構成製品の詳細
続いて、「インテルParallel Studio XE 2011」を構成する3つのツール「インテル Composer XE 2011」「インテル Inspector XE 2011」「インテル VTune Amplifier XE 2011」それぞれの特徴と、同時に発表された「インテルCluster Studio 2011」について個別に見ていこう。
インテル Composer XE 2011
「インテル Composer XE」は、並列化コンパイラーと並列化ライブラリーで構成されるコンパイル&デバッグ・ツールだ。旧製品のインテル・コンパイラー11.1から、12.0にあたるバージョンにバージョンアップし、性能も向上している。
インテル Composer XEが無印版と大きく違うところは、「インテルFortranコンパイラー XE」および、Fortranに対応したツールをバンドルしていることだろう(注1)。インテルFortranコンパイラー XEでは、Fortran 2003規格が完全にサポートされており、さらにCo-Array FortranなどFortran 2008標準の主要な機能が新しくサポートされている。
FortranだけでなくC/C++コンパイラーの性能も向上しており、最新のx86マルチコア・プロセッサー上で最高のパフォーマンスを実現するだけでなく、インテルの次世代プロセッサー「Sandy Bridge(開発コードネーム)」にも対応しており、Sandy Bridgeに搭載されるSSE後継のSIMD拡張命令セット「インテルAVX」による高度なべクトル化をサポートしている。
並列化のテンプレートライブラリとしては、インテルPBB(インテルParallel Building Blocks)が提供されている。これはインテルCilk Plus、インテルTBB、インテルABB(Array Building Blocks、注2)の3つのテクノロジーから構成されている。PBBの詳細は、「並列化の力強い相棒であり先生とも言える 最新版「インテルParallel Studio 2011」の真価とは」を参照してほしい。
このほかインテル・パフォーマンス・ライブラリーとして、インテルMKL(マス・カーネル・ライブラリー)とインテルIPP(インテグレーテッド・パフォーマンス・プリミティブ)もバンドルされている。それぞれアップデートされ、インテルMKL 10.3は、スレッド・セーフな算術ライブラリーとして、工学や科学から金融系まで幅広いアプリケーションに対応できる。インテルIPP 7.0は、マルチコアに対応したデータ処理ライブラリーで、マルチメディアデータなども扱うことができる。
また、インテルParallel Studio XE 2011には含まれない単独の製品となるが、Mac OS X 向けのコンパイラーとライブラリーも、「インテルC++ Composer XE Mac OS版」としてアップデートされた。これは、以前の「インテルC++コンパイラーMac OS版プロフェッショナル・エディション」に相当する。
Fortranコンパイラーが不要な開発者には、C/C++コンパイラーと最適化ツールなどを組み合わせた「インテルC++ Composer XE 2011」が、逆にC/C++コンパイラーが不要な開発者には「インテルFortran Composer XE 2011」も提供されている。
ベータ版として別途入手可能。
インテルParallel Inspector XE 2011とVTune Amplifier XE 2011
「インテルInspector XE」はスレッドとメモリーの解析ツールで、メモリーリークやメモリー破壊、データ競合やデッドロックといった難しい不具合を検出することができる。また、セキュリティの解析機能も追加され、より信頼性の高いアプリケーションを作成できるようになった。
「インテルVTune Amplifier XE」はVTuneパフォーマンス・アナライザーの後継版で、アプリケーションを最適にチューニングすることができる。パフォーマンス・プロファイラーによって、マルチコア・パフォーマンスのボトルネックを発見できる。インターフェイスが改善され、統計コールツリーや時間軸ビューが直感的に見やすくなっている。
ともに、無印のインテルParallel Studioにバンドルされる「インテルParallel Inspector」や「インテルParallel Amplifier」に比べて、より細かく数値を確認、調整することが可能だ。
インテルCluster Studio 2011
「インテルCluster Studio 2011」は、以前の「インテル クラスターツールキット コンパイラー エディション」をアップグレードしたもので、分散コンピューティング環境に対応した製品だ。
MPI(メッセージ・パッシング・インターフェイス)アプリケーション向けのパッケージであり、「インテル Composer XE」コンパイラーに、クラスター用のツールとして「インテルMPIライブラリー」と「インテル トレース・アナライザー/コレクター」がバンドルされる。
インテルMPIライブラリー 4.0 Update 1は、スケーラブルかつ堅固なMPIライブラリー。数万個のコアまでスケールし、カタログでは5万コア以上のHPCクラスタにおいて特に大きなスケーラビリティを発揮するとうたっているが、数個の小規模な分散環境でも十分な効果を発揮するという。
インテル トレース・アナライザー/コレクター 8.0 Update 1は、MPI開発者向けの解析ツールだ。MPIアプリケーションのエラーを高速に検出し、MPIメッセージのパフォーマンス・プロファイリングを提供する。並列化アプリケーションの負荷不均衡などの動作を視覚化し、hotspotを検出することができる。
インテル ソフトウェア製品のパフォーマンス/最適化製品に関する詳細は、「Optimization Notice」(英語)を参照してください。
まとめ
「インテルParallel Studio XE 2011」にパッケージされたツール群は、これまで上級レベルのHPC環境向けに提供されていたものだが、今回のリリースではビギナー層を除く、従来よりかなり広いレベルの開発者をターゲットにしている。
これは、並列化アプリケーションのパフォーマンスを高めたいという要求が、企業の研究所や学術分野だけでなく、メインストリームのさまざまなアプリケーション開発に広がっている状況を反映している。
ゼルダ氏によると、特に画像処理やアニメーション、ゲームといった分野で並列化に対する要求が高く、そうしたアプリケーションの開発者が多いアメリカと日本の2か国が、この分野では先行しているという。最近では大きな開発業者から並列化が導入され、そのパートナーである中小のソフトハウスでも導入を検討するケースも増えているという。
インテルでは、今後も「インテルParallel Studio」のブランドで、メインストリームの開発者に向けた並列化コンパイラー製品を提供し、インテルの次世代CPUのパワーを十二分に発揮するアプリケーション開発を支援していくとのことだ。
今回紹介したこれらの製品は、30日間無料評価版をエクセルソフト社のサイトからダウンロードすることができる。