米Amazonは、AIに関する新たな取り組みとして、新世代の基盤モデル「Amazon Nova」を構築したことを、12月3日(現地時間)に発表した。
現在、Amazon BedrockではAmazon Novaモデルとして、非常に低レイテンシなテキストのみのモデルである「Amazon Nova Micro」、画像・動画・テキスト入力を超高速で処理できる、非常に低コストなマルチモーダルモデルである「Amazon Nova Lite」、幅広いタスクに対応する精度・速度・コストの最適な組み合わせを備えた高性能なマルチモーダルモデル「Amazon Nova Pro」、複雑な推論タスクに対応し、カスタムモデルを抽出するための適切な教師として使用可能な、Amazonによるマルチモーダルモデル中もっとも優れた機能を備える「Amazon Nova Premier」(2025年第1四半期に利用可能)、最先端の画像生成モデル「Amazon Nova Canvas」、最先端の動画生成モデル「Amazon Nova Reel」を利用できる。
すべてのAmazon Novaモデルは、非常に高性能かつ高速で、コスト効率に優れており、顧客のシステムやデータで簡単に使えるよう設計されている。200の言語と複数のモダリティにわたる幅広いタスクをサポートする。Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Proは、Amazon Bedrockのそれぞれのインテリジェントクラスにおいて最高のパフォーマンスを発揮するモデルと比較して、少なくとも75%安価に利用可能であり、Amazon Bedrockのそれぞれのインテリジェントクラスにおいて最速のモデルでもある。
Amazon Novaモデルは、Amazon Bedrockと統合されており、Amazon Bedrockを通じてAmazon Novaモデルやその他の基盤モデルを簡単に試して評価し、自分たちが構築するアプリケーションにもっとも適したモデルを決められる。また、テキスト・画像・動画を含む顧客独自のデータから何がもっとも重要であるかを学習して、Amazon Bedrockがカスタマイズされた応答を提供するプライベートな微調整モデルをトレーニングする、といった使い方も可能となっている。
さらに、Amazon NovaモデルはAmazon Bedrockナレッジベースと統合され、RAG(Retrieval Augmented Generation:検索拡張生成)に優れているため、組織独自のデータに基づいて高い精度の応答を実現させられるほか、複数のAPIを通じて組織独自のシステムやデータとのやり取りを行い、複数ステップのタスクを実行する必要があるエージェントアプリケーションをより使いやすく、効果的になるよう最適化されている。
2025年には、音声対音声モデルと、ネイティブのマルチモーダル対マルチモーダルの「any-to-any」モダリティモデルを含む、2つのAmazon Novaモデルの新たな導入を予定する。音声対音声モデルは自然言語でのストリーミング音声入力を理解し、言語的/非言語的な手がかり(声のトーンや会話のリズムなど)を解釈して、人間のような自然な対話を実現できる。また、any-to-anyモデルはテキスト・画像・音声・動画を入力と出力の両方で処理可能で、同じモデルを使ってあるモダリティから別のモダリティを理解して生成できるAIエージェントの強化といった、さまざまなタスクを実行可能なアプリケーションの開発を簡素化する。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です