ソフトバンクは2月17日、米半導体設計企業Ampereと協力し、CPUを活用したAIモデル運用効率化の共同検証を開始した。
今回の検証では、ソフトバンクが開発する計算資源管理オーケストレーターと、AI推論向けAmpere製CPUを用い、Small Language Model(SLM)やMixture of Experts(MoE)など小規模AIモデルのCPU運用最適化を目指した。分散型環境下で、AIモデル配置や管理の最適化、消費電力を抑えつつ同時実行数を向上させる効果などを確認した。
両社は今後、AIエージェント向けに複数モデルを動的に切り替えながら、安定したAI推論が可能なプラットフォーム実現を進めていく。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
