米Modularは、12月4日(現地時間)にサンフランシスコで開催された年次イベント「ModCon '23」において、「Modular Accelerated Xecution(MAX)」、米Amazon Web Servicesとの戦略的パートナーシップ、米NVIDIAとのテクノロジーパートナーシップ、MAX EngineのGPUサポートなどの新機能を発表した。
Modular Accelerated Xecution(MAX)は、AIインフラストラクチャを簡素化し、低遅延、高スループットの生成パイプラインと従来の推論パイプラインを運用環境に導入するために必要なものをすべて提供する、統合された構成可能な製品スイート。
一般的なAIフレームワークのAIモデルを、すべてのCPUアーキテクチャとNVIDIA GPU上で最適化して実行する統合推論ライブラリであるMAX Engine(旧・AI Engine)、MAX Engineでモデルを提供するために構築された統合サービングフレームワークであるMAX Serving、AI専用に構築された初のプログラミング言語であり、Pythonの使いやすさとC言語のパフォーマンスを併せ持つMojoで構成されている。
MAXには、無料の非商用Developer Editionと、有料で商用利用が可能なEnterprise Editionが用意されており、2024年初頭に提供が開始される。
ModularとAmazon Web Servicesとの戦略的パートナーシップでは、AWS Gravitonプラットフォームをはじめとする、あらゆるAWSプロダクションサービスにMAX Enterprise Editionを独占的に提供することが発表された。
ModularとNVIDIAとのテクノロジーパートナーシップでは、MAXプラットフォームのパワーをNVIDIAのAIシステムに導入することによって、AIソフトウェアスタックを統合および簡素化し、強力なパフォーマンス、使いやすさ、拡張性を実現して、これまでにない方法でAIを構築して運用環境へ導入できるようにすると発表している。
新機能については、Mojoを使用したカスタム操作の記述によるMAX Engineにおける高度に最適化されたモデルの作成、依存関係なしで演算子を使用してモデルをグラフとして定義し、MAX Engineでグラフの実行を可能にするMAX Engine Graph API、MAXにおけるGPUのサポート(プレビュー)が発表された。
あわせて、Mojo SDK v0.6のリリースと、Mojoドキュメントのオープンソース化も発表されている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です