Googleは、3月26日、新しい音声生成AIモデル「Gemini 3.1 Flash Live」を発表した。これは、Geminiのリアルタイム対話機能をさらに進化させたもの。
Gemini 3.1 Flash Liveは、全体的な品質を向上させ、企業の複雑かつ大規模な音声エージェントの構築に対応。さまざまな制約条件の下で複数ステップの関数呼び出しを捉えるベンチマークであるComplexFuncBench Audioでは、以前のモデルと比較して90.8%というスコアを獲得し、トップの成績を収めた。
声色の理解能力が向上し、より自然な対話を実現している。また、ユーザーの不満や混乱といった感情表現に対して、より動的に反応を調整する能力も向上している。
さらに多言語に対応しており、200以上の国と地域のユーザーが希望する言語で検索機能とリアルタイムかつマルチモーダルな会話を楽しめるようになる。
詳細はブログポストから確認できる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
