SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

CodeZine Press

AMDのGPUプログラミング基盤「ROCm」とは何か──100%オープンソースで挑むソフトウェアスタックの現在地

AMDシンガポール取材レポート 前編:GPU開発環境を塗り替えつつある新勢力の今


LLMを本当に速く動かすためのライブラリ──AITERとMoRI

 ROCmスタックのパフォーマンスを底上げする2つのライブラリがある。Jung氏はハンズオンに先立ち、このライブラリについて丁寧な解説を行った。

フルスタックLLMソリューションの全体像
フルスタックLLMソリューションの全体像

 まずは「AITER(AI Tensor Engine for ROCm)」。LLMの内部はトランスフォーマーブロックと呼ばれる計算の積み重ねで動いているが、そのうちAttentionと呼ばれる部分は計算リソースを大量に消費し、素朴なPyTorchの演算子ではGPUの性能を十分に引き出せない。AITERはこの部分を高度に最適化した専用カーネル群だ。プロンプト処理を行う「Prefill」フェーズと、1トークンずつ生成する「Decode」フェーズとでは処理の特性がまったく異なるため、それぞれに特化したカーネルを用意している。DeepSeekのような最近のモデルが採用しているMLA(Multi-head Latent Attention)やMoE(Mixture of Experts)アーキテクチャにも対応済みで、vLLMとSGLangはすでにAITERに依存する形で動作している。開発者はVLLM_ROCM_USE_AITERという環境変数をオンにするだけで、その恩恵を受けられる。

 もう一つが「MoRI(Modular RDMA Interface)」だ。大規模なLLMを複数のGPU・複数のサーバーにまたがって動かす「P/D分離(Prefill/Decode分離)」アーキテクチャでは、サーバー間でKVキャッシュのデータを高速にやり取りする必要がある。MoRIはその通信を担うライブラリで、NVIDIAのNCCLやNIXLに相当する役割を果たす。AITERと同様、完全オープンソースとして提供されている。

AITERの概要
AITERの概要

AMD GPUクラスターでマルチエージェントを動かす

 午後はいよいよハンズオンだ。参加者はJupyterノートブックを通じて、TensorWaveが提供するMI355Xを16基搭載したクラスター(8基×2台)に接続し、vLLM上でLLMを動かす実習を行った。vLLMとは、LLMの推論・サービングに特化したオープンソースフレームワークで、OpenAI互換のエンドポイントを数行のコードで立ち上げられる。商用AIパイプラインのバックエンドとして広く使われている。

AMD プリンシパルAIソフトウェア開発エンジニア Seungrok Jung氏
AMD プリンシパルAIソフトウェア開発エンジニア Seungrok Jung氏

 ハンズオンで実際に作ったのは、2つのAIエージェントを組み合わせたマルチエージェントシステムだ。役割の異なるモデルを組み合わせることで、単一モデルでは難しいタスクをこなせるようになる。1つは司令塔となるOrchestratorエージェント(Qwenモデル)、もう1つは食品・医療の専門家として振る舞うConsultantエージェント(マルチモーダルモデル)だ。

 「キットカットの原材料は?」という質問を投げると、OrchestratorがMCP(Model Context Protocol)経由でウェブ検索ツールや食品成分データベース(Kaggle: OpenNutrition)にアクセスし、30Bモデル単体では得られない詳細な回答を生成する。さらに、バーコードの画像を読み込ませるとビジョンモデルが数値を抽出してAPIを叩き、成分の健康リスクまで分析するデモも披露された。ワークショップで使用したコードはGitHubで公開されている。

次のページ
ROCmを今日から試すための3つの入口

この記事は参考になりましたか?

CodeZine Press連載記事一覧

もっと読む

この記事の著者

近藤 佑子(編集部)(コンドウ ユウコ)

株式会社翔泳社 CodeZine編集部 編集長、Developers Summit オーガナイザー。1986年岡山県生まれ。京都大学工学部建築学科、東京大学工学系研究科建築学専攻修士課程修了。フリーランスを経て2014年株式会社翔泳社に入社。ソフトウェア開発者向けWebメディア「CodeZine」の編集・企画・運営に携わる。2018年、副編集長に就任。2017年より、ソフトウェア開発者向けカンファレンス「Developers...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

CodeZine(コードジン)
https://codezine.jp/article/detail/24187 2026/05/14 12:20

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング