米Google Cloudは、第6世代のGoogle Cloud TPU(Tensor Processing Unit)となる、「Trillium」を5月15日(現地時間)に発表した。
今回、発表されたTrilliumは、従来のTPU v5eと比較してチップあたりのピークコンピューティングパフォーマンスが4.7倍に達するとともに、高帯域幅メモリ(HBM)の容量と帯域幅が2倍になり、チップ間相互接続(ICI)の帯域幅も2倍になっている。
さらに、高度なランキングや推奨ワークロードで一般的な、超大規模なエンベディングを処理するための特殊なアクセラレータである、第3世代のSparseCoreを備えており、基礎モデルの次の波をより迅速にトレーニングして待ち時間を短縮する。一方で、TPU v5eと比較してエネルギー効率が67%以上優れているという。
単一の高帯域幅、低遅延のポッドによって、最大256TPUまで拡張できるほか、マルチスライステクノロジとチタンインテリジェンスプロセッシングユニット(IPU)を使用することで、さらに多くのポッドへの拡張が可能になり、1秒あたりマルチペタビットで相互接続されたスーパーコンピュータ内の数万個のチップとも接続できる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です