Googleは同社の大規模言語モデル「Gemini」の開発者向け新機能を試験的に公開した。「Google AI Studio」からプロンプトを送り込むことで利用できる。
今回はAndroidアプリケーションの開発に役立つ3種類の新機能を公開した。1つ目は、画像ファイルからアプリケーションのユーザーインターフェイスのコードを自動的に生成する機能。2つ目は、ユーザーインターフェイスのコードと、その実行結果の画像ファイル、そして改善したい部分から、実際に改善する方法を提示する機能。3つ目は、Geminiへの問い合わせ機能をアプリケーションに組み込むコードを生成する機能だ。
1つ目は、アプリケーションのユーザーインターフェースのイメージ画像をアップロードして、この画像のようなユーザーインターフェイスを構築したいと問い合わせると、Jetpack Composeのコードを返す機能。Geminiが返したコードは、開発中のアプリケーションにコピー&ペーストで組み込める。
2つ目の新機能では、ユーザーインターフェイスを実現するJetpack Composeのコードと、その実行結果のスクリーンショットをアップロードする。スクリーンショットには赤い枠を入れるなどして、改善したい部分を指示し、プロンプトで改善方法を問い合わせると、改善したコードを出力する。
3つ目の新機能は、コードの生成だけでなく、開発中のアプリケーションにGeminiの機能を組み込みやすくするものだ。Googleは例として、食料品の成分表示から、適切な料理のレシピを提示する機能を挙げている。具体的にはGoogle AI Studioで食料品の画像をアップロードして、適切な料理のレシピを問い合わせるプロンプトを送信する。Geminiの返答が満足のいくものなら、「Get Code」ボタンを押すことで、ソースコードを確認し、コピー&ペーストでアプリケーションに組み込める。
GoogleはGeminiなどの大規模言語モデルが、同じ入力に対して同じ方法で計算して同じ結果を返す「決定論的」なものではないために、おかしな返答を返してしまうことがあるという事実を挙げ、Geminiの開発者向け新機能を提供する際には、細心の注意を払っていると説明している。そしてその例として、Android Studioで試験的に提供しているコード生成機能を挙げた。この機能では、Geminiが生成したコードをそのまま本番として採用させるのではなく、開発者が考えたコードとGeminiが生成したコードの違いをはっきりと提示している。これは、どちらのコードが良いのかを開発者が吟味して判断できるようにしているからだとしている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です