Googleは2025年8月26日(現地時間)、最先端の画像生成および編集モデル「Gemini 2.5 Flash Image」を発表した。本モデルは、複数画像の合成、キャラクターの一貫性維持、自然言語による画像編集、高度な編集など、多機能な画像生成・処理を実現する。
Gemini 2.5 Flash Imageは、Gemini APIおよびGoogle AI Studioを通じて利用でき、エンタープライズ向けにもVertex AIで提供されている。料金は100万出力トークンごとに30.00ドル、1画像あたり1,290トークン(0.039ドル)となっている。その他のモダリティに関してはGemini 2.5 Flashの価格に準じる。
主な特徴としては、同一キャラクターを複数環境に配置して一貫性を保つ機能や、テンプレートに沿った多様なアセット生成能力がある。例えば、1つのプロダクトを様々な角度や背景で再現したり、ブランドアセットの連続生成も可能。
また、プロンプトによる画像編集では、背景のぼかしや汚れの除去、人物の削除、ポーズの変更、色付けなど、多様な指示を自然言語で可能にしている。さらに、Gemini 2.5 Flash Imageでは、手描き図の読解や教育分野にも活用できる。
加えて、複数の画像を理解し融合する能力を持ち、シーン合成や商品画像のモックアップ作成など、新たな用途も提示されている。全ての生成・編集画像にはデジタル透かし(SynthID)が埋め込まれ、AI生成物の識別も可能。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です