Googleは3月3日(現地時間)、AIモデル「Gemini 3.1 Flash-Lite」を開発者向けにプレビュー公開した。Gemini 3シリーズ中で最速かつ最もコスト効率に優れたモデルで、Gemini API(Google AI Studio)およびVertex AI経由で利用できる。
料金設定は、入力トークン100万単位で0.25ドル、出力トークン100万単位で1.5ドルと、従来モデルより低コストを実現している。性能面では、前バージョンの2.5 Flashと比較し、初回応答までの時間が約2.5倍短縮され、出力速度も45%向上した。また、推論やマルチモーダル理解でも高いベンチマークスコアを記録している。
Gemini 3.1 Flash-Liteは、高頻度ワークフロー向けの低遅延が求められる場面に適しており、翻訳やコンテンツモデレーション、大量データ処理などのタスクに加え、ユーザーインターフェイス生成やダッシュボード作成など複雑な業務にも対応可能だ。AI StudioとVertex AIでは、「思考レベル」の設定を標準で備え、業務内容やコスト要件に応じた柔軟な運用ができる。既に一部企業が試験導入しており、効率性や指示遵守性が評価されている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
