VTune Amplifier XEの機能紹介
VTune Amplifier XEは、パフォーマンス解析とチューニングを行うためのツールです。高性能なプロファイラとして知られているVTune パフォーマンス アナライザーにVisual Studioへの統合機能が追加されたことにより、Visual Studioからも 高度な解析を簡単な手順で行えるようになっています。
画面で見ながら解析方法を確認しましょう。
図5のようなVisual Studio画面上部のVTune Amplifier XEツールバーから解析アイコンをクリックします。
表示される[Choose Analysis Type]画面(図6)では、さまざまな種類の解析方法を選択できます。
[Algorithm Analysis]が基本となる解析カテゴリで、表5のようにいくつかの方法を選ぶことができます。
解析方法 | 意味 |
Hotspots | プログラム内で特に時間を消費しているホットスポット(=最適化すれば大きく性能向上する部分)の解析 |
Lightweight Hotspots | 高速なホットスポット解析 |
Concurrency | マルチスレッドによる並列処理が効率的に行われているかどうかの解析 |
Locks and Waits | 並列処理中に発生するロックと待機の解析 |
左側のツリーを横スクロールすると、図7のように、[Advanced Intel Core 2 Processor Family Analysis]と[Advanced Intel Microarchitecture Codename Nehalem Analysis]という解析カテゴリがあることが分かります。
これら2つは、VTune Amplifier XEの真骨頂とも呼べる、対象とするCPUに密着した形でコードの解析を行う方法です。前者はCore 2プロセッサを、後者はCore iプロセッサ(開発コードネームNehalem)を対象としています。それぞれの解析項目が異なるのは、プロセッサごとに最適化すべき分野が異なるためです。
ホットスポット解析とCPUに密着した解析
それでは、実際のサンプルで解析を行います。
今回は製品付属のtachyon_vtune_amp_xeサンプル({Parallel Studio XE 2011をインストールしたフォルダ}\VTune Amplifier XE 2011\samples\en\tachyon_vtune_amp_xe.zip)を使って解析を行ってみましょう。このサンプルは、レイトレーシングと呼ばれる手法で3D CGを作成するプログラムです。
最初はホットスポット解析を行いますので、[Hotspots]を選択して[Start]をクリックします。サンプルの実行完了後、図8のように解析結果が表示されます。
やや情報量が多い画面ですが、上部にCPU消費時間の長い関数名が列挙され、下部にスレッドごとのCPU使用率が表示されています。今回はinitialize_2D_buffer、grid_intersectという関数がそれぞれ30秒、20秒ほどの時間を消費しているようです。
画面上部の[Top-down Tree]をクリックすることで、図9のようにトップダウンでソースコード中の消費時間を確認することもできます。
また、前述のとおりVTune Amplifier XEではCPUに密着した解析も行えます。図10は[Advanced Intel Core 2 Processor Family Analysis]-[Cycles and uOps]を選択してCore 2プロセッサ向けに解析を行った結果です。ここではソースコードとコンパイルされたアセンブリコードが並べて表示されています。この解析では、各行でどの命令が何回実行されているか、といった非常に詳細な情報まで確認することができ、最適化に役立てることができます。
まとめ
本記事ではParallel Studio XE 2011の新機能を概観しました。基本的な使い方はParallel Studio 2011に似ている部分もありますが、確認できたとおり、より詳細な解析機能や、より高性能なアプリケーションを開発するための機能が搭載されています。
特にVTune Amplifier XEの解析の詳細さは他の追随を許さないものがあり、CPUを設計開発し、すべてを知り尽くしているインテル社の製品であるということを改めて感じさせられます。
インテル社では、Parallel Studio XE 2011と同時に、HPCクラスタ環境向けのインテル Cluster Studioもリリースしています。こちらの製品はC++ Composer XE、Fortran Composer XEに加え、数万コア以上のクラスター環境においても利用可能な並列ライブラリと、処理状況を解析するためのツールなども含まれています。
マルチコア化が進む中、よりハイパフォーマンスなアプリケーション開発のため、Parallel Studio XE 2011をぜひ活用してください。