生成AIとストレスなく付き合うために必要な環境とは
──まずは自己紹介をお願いします。
幸田章氏(以下、幸田):SB C&Sの幸田です。AIインフラ領域で技術支援するチームのマネージャーをしています。弊社はディストリビューターで、ITのソフトウェアやハードウェアを買い付けて国内のシステムインテグレーターさんに販売しています。私の部署ではNVIDIA製品全般を扱っています。
高橋想氏(以下、高橋):NVIDIAの高橋です。法人向けの製品担当で、デジタルツインを構成する開発プラットフォームのほか、今回テーマとなるNVIDIA DGX Spark(以下、DGX Spark)を担当しています。
──多くのエンジニア・開発者がChatGPTやCopilotを日常的に使うようになりました。この現状をどう考えておりますでしょうか?
幸田:業務の効率化も含め、産業全体が大きく変わる節目が目前に迫ってきているように感じます。
高橋:たしかに、生成AIの爆発的な普及があり、今やAIエージェントでの業務の支援や代替が当たり前に行われております。また、AIが論理的に考えて回答を導き出すリーズニングも登場していますので、インフラの強化が必要になると考えています。
またトレーニングでAIモデルを作るところでも、データやパラメーター数を多く必要とします。加えて、ファインチューニングや推論、リーズニングにおいても、コンピューティングのパワーが必要です。NVIDIAとしては、そのような現状をハードウェアやAI開発環境でサポートしていきたいと考えています。
──これからはアプリケーションにAIを組み込む機会が増えてくるかと思いますが、開発者はインフラを意識するべきなのでしょうか?
幸田:今後AIには、より高い精度や特定のドメイン知識が求められます。汎用的なデータだけで学習したモデルでは要求に応えられず、独自データを加えてトレーニング、あるいはファインチューニングをする必要があります。独自データの学習はクラウド環境でも可能ですが、現実的には性能やコストで課題が生まれてきます。また、機密保持の観点からデータをクラウドに配置することが難しい場合もあります。
結果として、オンプレミスにコンピュータリソースがあることが望ましいケースが増えてきます。またAIそのものに機密性があると考えると、オンプレミスで念入りに学習済みのAIをテストするケースも考えられます。オンプレミス環境を使うにしても、他の用途や他の学習と共用だと、安定的に占有できないケースも考えられます。
──生成AIの普及で企業が直面するインフラの課題には、どのようなものがあるでしょうか?
高橋:先ほどの幸田さんの回答と重複しますが、クラウドやデータセンターのリソースを使うとなると、必要な時にすぐにリソースが使えないことがあります。クラウドだと従量課金でコストがかかります。
あとセキュリティ面では、企業が保有するデータで学習させるとなると、外部(クラウド)に出せずローカル(オンプレ)環境で開発を進めたいというニーズが増えてきます。
幸田:AIが高度化するほどクラウドの限界にぶつかりやすく、要求にスムーズに追いついていけるのはオンプレだという肌感覚をもっています。
初めてのAI開発の導入に役立つGPU「NVIDIA DGX Spark」とは?
──DGX Sparkはこれまで出てきた課題の解決になるとのことですが、まずは概要や特徴を教えてください。
高橋:DGX Sparkはローカル環境でAI開発するニーズに応えるべく、新たにNVIDIAが開発した製品です。GB10 Grace Blackwellスーパーチップという弊社が開発しているCPU・GPUを搭載したシステムです。
AIモデルを扱う時、大きなモデルがメモリに乗りきらないというケースがあります。その点、DGX Sparkは128GBユニファイドメモリを搭載しており、より大きなAIモデル、より多くのパラメーター数を扱うことができます。さらに、2台を連結させてクラスタリングできるよう、ConnectX-7ネットワークを搭載しています。加えて、DGX OSやNVIDIA AIソフトウェアスタックを搭載しているため開発環境をスケールさせることにも役立ちます。
なおDGX Sparkは普通のPCのようにディスプレイやマウス・キーボードを接続してスタンドアロンで使用することも可能ですし、ネットワークに接続してPCやワークステーションのプライベートAIクラウドのような形で使うことも可能です。
──DGX OSやAIソフトウェアスタックについてもう少し詳しく教えてください。
高橋:DGX OSはLinux(Ubuntu)ベースのOSで、NVIDIAが提供するフレームワークはもちろん、サードパーティー提供のフレームワークもお使いいただけます。DGX Station、DGX Cloudなどでも使われていますので、DGX SparkとDGXシリーズの製品間でワークロードをシームレスに移動することができます。
AIソフトウェアスタックですが、例えばAI WorkbenchはAI開発プロジェクトで開発、管理、展開を統合的に使えるツールです。またNIM(NVIDIA Inference Microservices)は、AIモデルをデプロイするためのマイクロサービス群です。
DGX Sparkだけではなく、今後リリースされる予定のNVIDIA製品も含めて、DGXシリーズの製品と同じ環境(OS)で開発を進めていけるのが特徴です。
──2台接続できるとのことですが、どんな時に必要になるのでしょうか?
高橋:DGX Sparkは基本的には1人のユーザーで使うことを想定した設計になっています。1台では足りない場合に2台接続して使います。足りないというのは、モデルサイズが大きくてメモリが足りないケースです。
また、DGX Sparkは128GBのユニファイドメモリがあり(OSやツール領域を除くと約100GBほど)、FP4データフォーマットで2000億パラメーターくらいのAIモデルが使えます。これでも足りなければ、2台接続して4000億パラメーターくらいを扱えます。
──DGX Sparkでエンジニアの世界はどう変わるでしょうか?
高橋:これまですぐ手元で試すことができずにAI開発に遅れを生じさせていたのであれば、DGX Sparkでより迅速にトライアルを回すことができます。開発スピードを加速させ、成果物の品質をより向上させることができると考えています。
生成AI時代を生き抜くために。押さえておきたいキーワード
──企業がDGX Sparkを導入または活用するうえで、どのようなハードルが立ちはだかってくるでしょうか?
幸田:これまでAI開発のサーバーやワークステーションを扱ってきたエンジニアや研究者であれば、DGX Sparkの導入に全くハードルはないでしょう。むしろ簡単です。
またDGX Sparkは比較的安価で、初めてローカル環境でAI開発をする方にも最適です。また、そうした方々には、基本的なソフトウェアの扱い方や入手方法などを知る必要があると思います。その点は、SB C&Sがサポートいたします。
──ソフトウェアの使い方とは?
幸田:NVIDIAはNGCという、AIを活用するためのソフトウェア群のWebポータルを提供しています。このサイトで提供されるソフトウェアはコンテナ形式が多いので、その取得や起動に関するコマンドがメインになるかと思います。
ある程度経験を積んだエンジニアであれば、基本的なアクセス方法など最小限のことをお伝えすれば後は自走できるかと思います。
──インフラに直接関わってこなかったアプリケーションエンジニアが、今後アンテナを張っておくべきインフラのキーワードやポイントなどは何になりますか?
幸田:これまでアプリケーション開発でコーディングが中心でインフラにはあまり関わってこなかった方に意識していただきたいのは「AIOps」です。これはインフラの運用の効率化、そして自動化をAIによって実行していくためのソリューションや製品群になります。
いまAIOpsはDevOpsと並ぶ勢いで発展していて、新しいソフトウェアや概念がたくさん生まれている段階であり、DevOpsと同様に「開発者がITインフラをより迅速に、効率よく利用する」こともその目的に含まれています。これまでのアプリケーション開発に加えて、GPUサーバーを中心としたリソースが必要になる「AIを活用するアプリケーション」の開発も増えてくることが見込まれます。開発者がリソースを確保するためのプロセスはより複雑化するので、その自動化・効率化を目指すAIOpsは、主にインフラに関わるキーワードであると同時に、AIとアプリケーションの開発にも関わってくる重要なキーワードになります。
高橋:先ほどのソフトウェアスタックの中でいう、NIMとAI Blueprintsを押さえていただくといいかと思います。特にインフラになじみがなかった方ほど役立ちます。
AIの開発をする時、オープンソースのモデルやGPUのドライバーなど環境整備が必要になります。しかし情報がまとまっているわけではなく、バージョンも変わるので、普段開発しているとボトルネックになりがちです。その点、NVIDIAはAI開発に集中できるように、すぐに最適なパフォーマンスを発揮できるように提供しているのがNIMです。ドライバーや環境に合わせてチューニングずみです。
AI Blueprintsはユースケース別のリファレンスアプリケーションです。ユースケースごとにAIエージェント型アプリケーションを迅速に構築・展開するためのリファレンスとなるワークフローやツール群を示しています。これを参考にして、必要に応じてカスタマイズしていただければ、より迅速かつ効率的に開発を進められると思います。

──生成AI時代を生きるエンジニアに向けてメッセージをお願いします。
高橋:NVIDIA CEOのJensen Huangは「AIに仕事を奪われるのではない。AIをよく知る人間に仕事を奪われるのだ」と言っています。これからは、AIをよく活用する・よく知ることがご自身の価値を高めることにつながります。それを手助けできるように、NVIDIAはハードウェアやAI開発環境のための仕掛けなどをご用意していますので、ぜひご活用ください。
幸田:いま生成AIはまさに実用レベルに達し、今後はいかに活用するかにフォーカスが当たります。なるべく早くAIの世界に入れば、次の時代のビジネスを素早くキャッチアップできると考えております。DGX SparkをAIの世界に入るきっかけにしていただければと思います。DGX Sparkは自分だけのGPUコンピュータリソースになりますので、AIの世界にどっぷり入っているベテランでも、これから始める人にもお勧めです。

