NVIDIAは12月15日、エージェント型AIアプリケーション向けのオープンモデルファミリー「Nemotron 3」を公開した。Nemotron 3はNano、Super、Ultraの3サイズで構成され、ハイブリッド型のMixture-of-Experts(MoE)アーキテクチャを採用している。
Nemotron 3 Nanoは300億パラメータを持つ小型モデルで、最大30億パラメータが同時に活性化。従来のNemotron 2 Nanoに比べトークンスループットは4倍に向上し、推論トークン生成コストは最大60%削減された。100万トークンのコンテキストウィンドウを備え、ソフトウェアデバッグや要約、低コストな情報検索など広範なタスクに対応する。
Superは1000億パラメータ、Ultraは5000億パラメータ規模で、複雑なマルチエージェントAIアプリケーションや高度なリーズニングタスクに最適化される。Super/UltraはNVIDIA Blackwellアーキテクチャと4ビットNVFP4トレーニングフォーマットを採用し、メモリ要件を削減しつつ高精度を維持している。これにより既存インフラでもより大規模なモデルのトレーニングが可能となる。
モデルに加え、NVIDIAは3兆トークンに及ぶ多様なAIトレーニングデータセットや、強化学習・評価用オープンソースライブラリも提供する。Nemotron 3 NanoはHugging Faceや主要クラウドサービスで本日より利用可能。SuperおよびUltraは2026年上半期の提供開始を予定している。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
