米Amazon Web Servicesは、ラスベガスにて開催されている年次イベント「AWS re:Invent」において、機械学習トレーニングや生成AIアプリケーションを含む、幅広いワークロードにおいて優れたコストパフォーマンスとエネルギー効率を実現するチップファミリー「AWS Graviton4」と「AWS Trainium2」を、11月29日(現地時間)に発表した。
AWS Graviton4は、現行のGraviton3と比較して最大30%優れたコンピューティングパフォーマンス、50%多いコア、75%多いメモリ帯域幅を提供し、Amazon EC2で実行される幅広いワークロードに対して、優れたコストパフォーマンスとエネルギー効率を実現する。
すべての高速物理ハードウェアインターフェースを完全に暗号化することによって、高水準のセキュリティを提供するとともに、メモリ最適化されたAmazon EC2 R8gインスタンスで利用できるようになったため、高性能データベース、インメモリキャッシュ、ビッグデータ分析ワークロード実行の改善が可能になる。
R8gインスタンスは、現行のR7gインスタンスと比較して、最大3倍のvCPUと3倍のメモリを備えた、より大きなインスタンスサイズを提供し、大量のデータ処理、ワークロードの拡張を通じて結果が得られるまでの時間を短縮し、総所有コストを削減できる。AWS Graviton4を搭載したR8gインスタンスは現在プレビューにて利用可能であり、今後数か月以内の一般提供を予定している。
AWS Trainium2は、第1世代のTrainiumチップと比較して、最大4倍高速なトレーニングを提供するよう設計され、最大100000チップのEC2 UltraClusterにデプロイ可能なので、基礎モデル(FM)と大規模言語モデル(LLM)をわずかな時間でトレーニングできるようになる。また、エネルギー効率が最大2倍向上する。
最大数兆のパラメータを使用したFMおよびLLMの高性能トレーニングを目的として構築され、Amazon EC2 Trn2インスタンスで利用可能となっており、単一のインスタンスに16個のTrainiumチップが含まれる。Trn2インスタンスは、次世代EC2 UltraClusterで、AWS Trainium2を100000個までスケールアップできるようにすることを目的としている。AWS Elastic Fabric Adaptor(EFA)ペタビットスケールのネットワーキングと相互接続され、最大65エクサフロップスのコンピューティングによってスーパーコンピュータクラスの性能へのオンデマンドアクセスを提供する。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です