米Google Cloudは、Vertex AI Model Gardenにて新たなLLMである「Gemma 3」が利用可能となったことを、3月13日(現地時間)に発表した。
今回の、Vertex AI Model GardenにおけるGemma 3の提供開始によって、ただちにGemma 3にアクセスしてファインチューニングやデプロイを実施できるようになり、Vertex AIのビルド済みコンテナとデプロイツールを使用して、Gemma 3をユースケースに迅速に適応させられるようになった。
Gemma 3のファインチューニングでは、フルファインチューニングと比較して大幅に少ないコンピューティングリソースでパフォーマンスの向上を実現し、vLLMベースのデプロイなので使いやすく高速で、vLLMの最適化された推論エンジンによってスループットを最大化して、レイテンシを最小限に抑え、Vertex AI上のGemma 3アプリケーションにレスポンシブでスケーラブルなエンドポイントを確保する。
Vertex AI Model Gardenでは、Hugging FaceのPEFT(LoRA)を使用してGemma 3を数ステップでファインチューニングしてデプロイ可能となっている。Vertex AI上のGemma 3をユースケースに合わせてファインチューニングするには、カスタムデータセットが必要となり、各行が有効なJSON文字列になっているJSONLファイルが推奨される。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です