Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

ハイエンドなアプリケーションのためのツール・スイート「インテル Parallel Studio XE 2011」

Parallel Studio XE 2011の新機能紹介

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2010/11/26 14:30
目次

VTune Amplifier XEの機能紹介

 VTune Amplifier XEは、パフォーマンス解析とチューニングを行うためのツールです。高性能なプロファイラとして知られているVTune パフォーマンス アナライザーにVisual Studioへの統合機能が追加されたことにより、Visual Studioからも 高度な解析を簡単な手順で行えるようになっています。

 画面で見ながら解析方法を確認しましょう。

 図5のようなVisual Studio画面上部のVTune Amplifier XEツールバーから解析アイコンをクリックします。

図5 VTune Amplifier XEツールバーの解析アイコンで解析を行う
図5 VTune Amplifier XEツールバーの解析アイコンで解析を行う

 表示される[Choose Analysis Type]画面(図6)では、さまざまな種類の解析方法を選択できます。

図6 [Choose Analysis Type]画面。解析方法とオプションを選択できる
図6 [Choose Analysis Type]画面。解析方法とオプションを選択できる

 [Algorithm Analysis]が基本となる解析カテゴリで、表5のようにいくつかの方法を選ぶことができます。

表5 [Algorithm Analysis]で選択できる解析方法
解析方法 意味
Hotspots プログラム内で特に時間を消費しているホットスポット(=最適化すれば大きく性能向上する部分)の解析
Lightweight Hotspots 高速なホットスポット解析
Concurrency マルチスレッドによる並列処理が効率的に行われているかどうかの解析
Locks and Waits 並列処理中に発生するロックと待機の解析

 左側のツリーを横スクロールすると、図7のように、[Advanced Intel Core 2 Processor Family Analysis]と[Advanced Intel Microarchitecture Codename Nehalem Analysis]という解析カテゴリがあることが分かります。

図7 VTune Amplifier XEで可能な解析の種類
図7 VTune Amplifier XEで可能な解析の種類

 これら2つは、VTune Amplifier XEの真骨頂とも呼べる、対象とするCPUに密着した形でコードの解析を行う方法です。前者はCore 2プロセッサを、後者はCore iプロセッサ(開発コードネームNehalem)を対象としています。それぞれの解析項目が異なるのは、プロセッサごとに最適化すべき分野が異なるためです。

ホットスポット解析とCPUに密着した解析

 それでは、実際のサンプルで解析を行います。

 今回は製品付属のtachyon_vtune_amp_xeサンプル({Parallel Studio XE 2011をインストールしたフォルダ}\VTune Amplifier XE 2011\samples\en\tachyon_vtune_amp_xe.zip)を使って解析を行ってみましょう。このサンプルは、レイトレーシングと呼ばれる手法で3D CGを作成するプログラムです。

 最初はホットスポット解析を行いますので、[Hotspots]を選択して[Start]をクリックします。サンプルの実行完了後、図8のように解析結果が表示されます。

図8 ホットスポット解析の結果。CPU消費時間の長い関数名が列挙されている
図8 ホットスポット解析の結果。CPU消費時間の長い関数名が列挙されている

 やや情報量が多い画面ですが、上部にCPU消費時間の長い関数名が列挙され、下部にスレッドごとのCPU使用率が表示されています。今回はinitialize_2D_buffer、grid_intersectという関数がそれぞれ30秒、20秒ほどの時間を消費しているようです。

 画面上部の[Top-down Tree]をクリックすることで、図9のようにトップダウンでソースコード中の消費時間を確認することもできます。

図9 トップダウンでの表示。[Total]から関数呼び出し順に消費時間を見ることができる
図9 トップダウンでの表示。[Total]から関数呼び出し順に消費時間を見ることができる

 また、前述のとおりVTune Amplifier XEではCPUに密着した解析も行えます。図10は[Advanced Intel Core 2 Processor Family Analysis]-[Cycles and uOps]を選択してCore 2プロセッサ向けに解析を行った結果です。ここではソースコードとコンパイルされたアセンブリコードが並べて表示されています。この解析では、各行でどの命令が何回実行されているか、といった非常に詳細な情報まで確認することができ、最適化に役立てることができます。

図10 アセンブリコードも含めた解析結果表示
図10 アセンブリコードも含めた解析結果表示

まとめ

 本記事ではParallel Studio XE 2011の新機能を概観しました。基本的な使い方はParallel Studio 2011に似ている部分もありますが、確認できたとおり、より詳細な解析機能や、より高性能なアプリケーションを開発するための機能が搭載されています。

 特にVTune Amplifier XEの解析の詳細さは他の追随を許さないものがあり、CPUを設計開発し、すべてを知り尽くしているインテル社の製品であるということを改めて感じさせられます。

 インテル社では、Parallel Studio XE 2011と同時に、HPCクラスタ環境向けのインテル Cluster Studioもリリースしています。こちらの製品はC++ Composer XE、Fortran Composer XEに加え、数万コア以上のクラスター環境においても利用可能な並列ライブラリと、処理状況を解析するためのツールなども含まれています。

 マルチコア化が進む中、よりハイパフォーマンスなアプリケーション開発のため、Parallel Studio XE 2011をぜひ活用してください。

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 山田 祥寛(ヤマダ ヨシヒロ)

    静岡県榛原町生まれ。一橋大学経済学部卒業後、NECにてシステム企画業務に携わるが、2003年4月に念願かなってフリーライターに転身。Microsoft MVP for ASP/ASP.NET。執筆コミュニティ「WINGSプロジェクト」代表。 主な著書に「入門シリーズ(サーバサイドAjax/XMLD...

  • WINGSプロジェクト 土井 毅(ドイ ツヨシ)

    <WINGSプロジェクトについて> 有限会社 WINGSプロジェクトが運営する、テクニカル執筆コミュニティ(代表 山田祥寛)。主にWeb開発分野の書籍/記事執筆、翻訳、講演等を幅広く手がける。2018年11月時点での登録メンバは55名で、現在も執筆メンバを募集中。興味のある方は、どしどし応募頂...

All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5