Microsoftは、1月26日、AIトークン生成を効率化するアクセラレータ「Maia 200」を発表した。
Maia 200は、AI推論の原動力となるアクセラレータ。TSMCの3nmプロセス上に構築され、ネイティブのFP8/FP4テンソルコアを搭載し、7TB/秒の216GBのHBM3eメモリ、272MBのオンチップSRAMを備えた新しいメモリシステム、そして大規模モデルに高速かつ効率的にデータを供給するエンジンを備えている。
OpenAIの最新モデルGPT-5.2を含む複数のモデルをサポート。1400億個以上のトランジスタを搭載し、大規模AIワークロードに最適化されたコスト効率の高いパフォーマンスを実現した。
Maia 200は、米国中部データセンターリージョンで導入されており、追加のグローバルロケーションへの展開が計画されている。Maia SDKのプレビュー版もリリースされ、PyTorch統合、Tritonコンパイラ、最適化されたカーネルライブラリなどにアクセスできる。
詳細はMicrosoft公式ブログで確認できる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
