米Google Cloudは、ラスベガスにて開催されている年次イベント「Google Cloud Next '24」において、モデルのアップデートやプラットフォーム強化といった、「Vertex AI」のさらなる機能強化を4月10日(現地時間)に発表した。
モデルのアップデートとしては、過去2か月の間に、Vertex AIに米GoogleのGemini 1.0 Proや、Geminiの開発に使用した研究とテクノロジに基づく軽量なオープンモデルファミリーであるGemma、AnthropicのClaude 3モデルファミリーといった、さまざまなファーストパーティ、サードパーティ、オープンモデルへのアクセスを追加している。
あわせて、Vertex AIのGemini 1.5 Proが、スピーチや動画の音声などを含むオーディオストリームの処理をサポートすることが発表された。これにより、テキスト、画像、動画、音声から洞察を提供するシームレスなクロスモーダル分析が可能になり、決算説明会や投資家会議での質問の書き起こし、検索、分析、回答などに活用できる。
さらに、同日にプレビュー公開されたテキストからライブ画像への変換機能によって、Imagenはエンタープライズワークロードにおける強力なツールとなり、マーケティングチームやクリエイティブチームはGIFなどのアニメーション画像をテキストプロンプトから生成可能になった。現時点では、24fps、解像度360×640ピクセル、長さ4秒のライブ映像の生成に留まるが、今後継続的に強化が行われる。
Imagen 2.0では画像生成機能もアップグレードされ、インペインティングやアウトペインティングといった高度な写真編集機能が一般提供されている。また、Google DeepMindにおけるSynthIDを利用した電子透かしも一般提供され、Imagenファミリーのモデルによって生成された画像とライブ画像の検証が可能になる。
ほかにも、生成AIにおける最大の課題であるプロンプトの実験と移行、プロンプトとパラメータの追跡を対象にしたVertex AIプロンプト管理、特定のタスクセットにおいてモデルを比較できるVertex AIの評価ツールが公開されるとともに、Vertex AI上のGemini、Imagen、Embeddings APIのData Residency(DRZ)を、オーストラリア、ブラジル、フィンランド、香港、インド、イスラエル、イタリア、ポーランド、スペイン、スイス、台湾の11か国に拡大した。さらに、Gemini 1.0 ProとImagenを使用する際に、機械学習処理をアメリカまたはEUに制限することが可能になっている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です