Googleは、10月3日、「Gemini 2.5 Flash Image」を含む生成モデルモデルスイートのメジャーアップデートを発表した。
「Gemini 2.5 Flash Image」は、画像生成・編集のモデルで、複数画像の合成、キャラクターの一貫性維持、自然言語による画像編集、高度な編集など、多機能な画像生成・処理を実現する。
今回の正式リリースによって、Google Cloud のエンタープライズグレードのインフラストラクチャとセキュリティを基盤とした本番環境に対応した。さらに、このモデルは複数のアスペクト比の画像を作成し、バッチ処理もサポートしている。
また、そのほかのモデルのアップデートも公開された。AI動画生成の「Veo 3」には、9:16比の縦型動画出力、複数秒の長さ選択といった新機能が追加されており、クリエーターが柔軟にストーリーを生成できるようになった。
さらに、テキスト画像変換モデル「Imagen 4」と、テキスト読み上げの「Gemini 2.5 TTS」も一般提供を開始した。
Gemini 2.5 Flash Image、Veo 3、Imagen 4、およびGemini 2.5 TTSは現在Vertex AIで利用可能になっている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です