ガートナージャパンは、「生成AIのハイプ・サイクル:2024年」を9月10日に発表し、2027年までに生成AIソリューションの40%が、マルチモーダル(テキスト、画像、動画といった複数タイプのデータを一度に処理することを指す)になるとの見解を示した。生成AIのマルチモーダルへの移行は、人間とAIとのインタラクションを強化し、生成AIソリューション差別化につながる。
マルチモーダル生成AIは、米Gartnerによる「生成AIのハイプ・サイクル:2024年」にて、オープンソースの大規模言語モデル(LLM)とともに「早期に採用することで顕著な競争優位性と市場投入までの期間短縮をもたらす可能性があるテクノロジ」に挙げられており、両者とも今後5年以内に組織にとって大きな影響を及ぼす可能性がある。
あわせてGartnerは、ドメイン固有の生成AIモデルと自律エージェントを、10年以内に主流の採用に達すると予測している生成AIイノベーションの中でも、その可能性がとりわけ高いものとして挙げている。
マルチモーダル生成AIとは、通常では実現不可能な新しい機能を実現することによって、エンタープライズアプリケーションに変革をもたらすテクノロジであり、その影響はAIと人間とのあらゆる接点に及ぶ。現時点では、多くのマルチモーダルモデルが2〜3のモードに限定されているものの、今後数年でさらに多くのモードが組み込まれるようになると予想される。
オープンソースのLLMは、商用アクセスを民主化し開発者が特定のタスク/ユースケース向けとしてのモデルの最適化を可能にすることで、生成AI導入による企業のメリットをさらに高めるディープラーニングのファウンデーションモデルといえる。
ドメイン固有の生成AIモデルは、特定の業界やビジネス機能、タスクのニーズに最適化されたモデルで、企業内におけるユースケースの整合性を改善するとともに、精度・セキュリティ・プライバシーを高め、よりコンテキストに沿った回答の提供を可能にする。同モデルでは、汎用モデルほど高度なプロンプトエンジニアリングは不要になるため、対象を絞ったトレーニングを通じてハルシネーション(ねつ造された回答)のリスクを下げられる。
自律エージェントは、人間が介入することなく定義された目標を達成できる複合システムで、さまざまなAI技術の利用によって環境におけるパターンを識別して意思決定を行い、一連のアクションを実行してアウトプットを生成する。環境を学習し続けることで性能が向上するため、次第により複雑なタスクへの対処が可能になるとも考えられている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です