Google DeepMindは6月22日(現地時間)、Geminiモデルとエージェント向けの「Interactions API」が一般提供(GA)となり、同社の主要APIとなったことを発表した。
Interactions APIは2025年12月にパブリックベータとして公開されていたが、今回の一般提供により、開発者向けドキュメントやSDK、ライブラリの標準インターフェースとなる。
新たなAPIは安定したスキーマを採用し、開発者から要望の多かった「Managed Agents」や「バックグラウンド実行」、ツールの組み合わせ、画像・音声などのマルチモーダル生成への対応など、多くの機能強化が行われた。Managed Agentsでは、1つのAPIコールで遠隔Linuxサンドボックスが用意され、ウェブ閲覧やファイル管理などのタスクを遠隔実行できる。
また「background=True」設定によりサーバー側で非同期処理が可能となり、Google 検索やGoogleマップの機能を自作関数と統合して呼び出すこともできる。画像生成や音声生成などメディア生成機能も拡充している。料金面では、コスト重視や低遅延を選べるティアや、過去55日分の履歴取得機能が追加された。
Interactions APIはGoogle AI StudioやGemini APIの標準であり、既存のgenerateContent APIも引き続きサポートされるが、今後の主要機能にはInteractions APIが利用される予定だ。PythonやJavaScript SDK経由で利用でき、移行ガイドも提供されている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
