Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

正しい分析でムダなくチューニング
アプリの並列化を支援する「インテル Parallel Amplifier」

インテルParallel Amplifierによるアプリケーションのボトルネック分析

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2010/07/01 14:00

目次

アプリケーションのHotspot分析

 最初に紹介するアプリケーションのHotspot分析は、並列処理実装に先立って行い、アプリケーションのどの部分を並列化するかの検討に役立てることができます。Parallel Amplifierは、解析対象アプリケーションを実行し、各関数ごとにどれだけの時間が掛かっているかを解析し、ビジュアルに表示することで、開発者がボトルネックを見分けられるようにしてくれます。

 では早速Hotspot分析を行いましょう。今回はParallel Studioインストール時に同梱されている、「NQueens-ParallelStudio」というサンプルを使用します。

 NQueens-ParallelStudioサンプルは、N-クイーン問題と呼ばれる「N×Nサイズのチェス盤上にチェスのクイーンN個を、相互に取られることのない位置に配置するパズル」を解くプログラムです。ルールの詳細はWikipediaのエイト・クイーンなどを参照してください。

 N-クイーン問題はバックトラックアルゴリズムの学習サンプルとしてもよく使われます。今回はN-クイーン問題のすべての配置パターンを探索するアルゴリズムを、並列処理することで高速化する、というシナリオでParallel Amplifierを活用します。

 サンプルはデフォルト設定のインストールでは以下のパスに存在しますので、展開し、ソリューションファイルである「NQueens-ParallelStudio.sln」を開きましょう。

C:\Program Files\Intel\Parallel Studio\Samples\en_US\NQueens-ParallelStudio.zip

 なお、このソリューションファイルはVisual Studio 2005用のため、2008で開くとVisual Studio変換ウィザードが実行されますので、ウィザードの手順に沿って変換してください。ソリューションファイルを開くと、図2のように3つのプロジェクトが存在します。

図2 サンプルの構成。並列処理の流れに沿って3つのプロジェクトが存在する
図2 サンプルの構成。並列処理の流れに沿って3つのプロジェクトが存在する

 「Step1-Serial-Hotspot」プロジェクトは、並列化前のシングルスレッドアプリケーションです。まずはこのアプリケーションを対象にHotspot分析を行います。

 Parallel Amplifierの機能は、図3のツールバーにまとめられています。また、[ツール]-[Intel Parallel Amplifier]メニューからも実行することができます。

図3 Parallel Amplifierツールバー
図3 Parallel Amplifierツールバー

 分析を始める前に、プロジェクトの構成を[Debug]から[Release]に切り替えます。これは、デバッグ用の処理などを含まない、アプリケーションの実際のパフォーマンスを分析するためです。プロジェクトをビルドした後、ツールバーの[分析の種類]ドロップダウンで[Hotspots - Where is my program spending time?]を選択し、[Profile]ボタンをクリックします。

 コマンドプロンプトでアプリケーションが実行され、実行終了後、Visual Studio上に図4のような分析画面が表示されます。

図4 シングルスレッドアプリケーションのHotspot分析
図4 シングルスレッドアプリケーションのHotspot分析

 Hotspot分析結果は、アプリケーション内のどの関数でどれだけのCPU時間が消費されたかを表示します。ここでは、アプリケーションのエントリポイントであるmain関数に10.727ms、N-クイーン問題の解の探索を行うsetQueen関数に520.523msが消費されており、setQueen関数を並列処理することで高速化が見込めることを読み取れます。また、この画面で各関数をダブルクリックすると、図5のように関数内の各箇所でどれだけの時間が消費されているかを確認することができます。

図5 関数内の消費時間表示
図5 関数内の消費時間表示

 また、上部の[Top-down Tree]をクリックすると、図6のように関数の並び方が変わり、呼び出し元から呼び出し先へと関数のコールスタックに沿って消費時間が表示されるようになります。

図6 コールスタックによる消費時間表示
図6 コールスタックによる消費時間表示

 Hotspot分析を使うことで、アプリケーションの並列処理すべき部分を明確化することができます。また、並列化後のアプリケーションをHotspot分析することで、並列化がアプリケーション全体の高速化に貢献しているかどうかも確認することができます。


  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 山田 祥寛(ヤマダ ヨシヒロ)

    静岡県榛原町生まれ。一橋大学経済学部卒業後、NECにてシステム企画業務に携わるが、2003年4月に念願かなってフリーライターに転身。Microsoft MVP for ASP/ASP.NET。執筆コミュニティ「WINGSプロジェクト」代表。 主な著書に「入門シリーズ(サーバサイドAjax/XMLD...

  • WINGSプロジェクト 土井 毅(ドイ ツヨシ)

    <WINGSプロジェクトについて> 有限会社 WINGSプロジェクトが運営する、テクニカル執筆コミュニティ(代表 山田祥寛)。主にWeb開発分野の書籍/記事執筆、翻訳、講演等を幅広く手がける。2018年11月時点での登録メンバは55名で、現在も執筆メンバを募集中。興味のある方は、どしどし応募頂...

バックナンバー

連載:インテルソフトウェア開発製品による並列化プログラミング
All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5