Google DeepMindは5月19日(現地時間)、マルチモーダルAIの新モデル「Gemini Omni Flash」を発表した。
Gemini Omni Flashは、画像、音声、動画、テキストを入力情報として組み合わせ、高品質な動画を生成できる点が特徴である。また、生成した動画も自然言語による指示で簡単に編集でき、編集作業は逐次的に内容を追加・修正できる。
同モデルは、GeminiアプリやGoogle Flow、YouTube Shortsで順次公開されており、AI Plus、Pro、Ultraの各種有料ユーザーには即日展開されている。YouTube ShortsおよびYouTube Createアプリのユーザーにも、今週より追加費用なしで提供される。今後数週間以内には、開発者や企業向けにAPIとしても展開される予定だ。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
