Googleは5月20日(現地時間)、新たなAIモデル「Gemma 3n」のプレビュー提供の開始を発表した。Gemma 3nは、スマートフォンやタブレット、ノートPCなどのモバイルデバイス上で動作することを前提に、高速・高効率を追求したオープンモデル。
本モデルは、Qualcomm Technologies、MediaTek、Samsung System LSIと協力して開発された新アーキテクチャを採用し、モバイル端末上でリアルタイムのパーソナルかつプライベートなAI体験を実現する。Google DeepMindの「Per-Layer Embeddings(PLE)」技術により、従来よりも大幅にメモリ消費を抑制、全パラメータ数は5Bと8Bながら、実際の動的メモリ使用量を2GBおよび3GBに抑えている。これにより、従来の2Bと4Bモデル並みの省メモリ動作が可能となった。
Gemma 3nは、テキスト・画像・音声・動画の各モダリティに対応し、特に音声認識・翻訳機能が大きく強化されている。また、1つのモデル内に2Bサブモデルを内包することで、用途に応じ柔軟に性能や品質を切り替えられる「mix’n’match」機能も搭載している。マルチリンガル対応も強化され、日本語を含む主要言語での性能向上が確認されている。また、プライバシー保護にも重点を置き、完全なオフライン動作が可能である。
クラウド上で利用可能なGoogle AI Studio、ならびにローカル組込み用のGoogle AI Edgeツールが提供されており、開発者向けに早期プレビュー版が公開されている。
GoogleはGemma 3nのリリースにあたり、徹底した安全性評価やデータガバナンスを重視し、今後も責任あるAIの開発を続けていく方針を示している。Gemma 3nは、今後AndroidやChromeなど主要プラットフォームで利用可能になる予定である。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です