AI/ML機能を組み合わせ、ビジネスに生かした事例:ポケトークとNew York Times
現在Google Cloudで提供されている事前学習済みモデル(APIサービス)には、画像分析のVision API、動画分析のVideo Intelligence、テキスト分析のNatural Language API、翻訳のTranslation API、読みあげのText-to-Speech API、音声認識のSpeech-to-Text APIなどがある。
こうした学習済みのモデルはできることが明確だ。何ができるかを把握したうえで、既存ビジネスプロセスでAPIを利用できるポイントがないかどうか、ビジネス側のユーザーも交えて見いだしていくのがいいだろう。
ここからは実際に学習済みのモデルを組み合わせた活用事例を紹介する。1つ目はポケトーク。手のひらサイズで外国人との会話をサポートしてくれる頼もしい翻訳機だ。日本語で話すと、自動的に外国語に翻訳して読みあげてくれる。
このポケトークにはGoogle CloudのAPIサービスが活用されている。何が使われているかは想像しやすいだろう。まずは音声認識(Speech-to-Text API)、次に機械翻訳(Translation API)、そして音声合成(Text-to-Speech API)を順に利用している。Google CloudのAPIを採用した理由は精度と高速なレスポンスだったという。言語のカバレッジも広く、コスト的にもメリットがあったそうだ。
2つ目はアメリカの新聞社New York Times。歴史ある新聞社なので倉庫には過去の貴重な資料が大量に保存されている。紙や写真、切り抜きや手書きのメモも混在する。デジタルではないために活用し切れていない状態だった。
中井氏は「ここにはもともと資料(データ)が存在していました。AI/MLで新しい価値を生み出すことを期待する方もいますが、何もないところから価値がうまれることはあまりありません。既存ビジネスの中にある価値を取り出せない時にAI/MLを活用するのがポイントです」と話す。
同新聞社では片っ端からデジタル化して検索可能にした。スキャン後にAutoMLで画像分類やテキスト文書の解析などの自動モデル構築を進めていった。
AutoML Tablesは表形式データを用いた汎用(はんよう)的な回帰モデル、分類モデルを作成するものだ。多くのビジネス現場で表形式のデータを扱うので役に立つだろう。ただし既存データの品質がよくなければ、いいモデルにならない。だが再学習とデータ収集を繰り返すことで性能を上げていくことができる。これはMLOpsにも通じる考えとなる。
今回はAI/MLソリューションのレイヤー構造をテーマに解説した。SaaS的なアプリケーションを構築するには、PaaS的なものを組み合わせることも可能だ。今回IaaSレイヤーにはあまり言及しなかったが、Google CloudにはVertex AIなどMLOpsを支えるソリューションもある。中井氏は「まずは自分たちにとって最も重要な部分から順番に使い、段階的にMLOps環境を作ることもできます」と言う。
最後に中井氏はデベロッパーやエンジニア向けのGoogle Cloud Innovatorsプログラムを紹介した。登録するとイベント、情報共有、ニュースレターが提供される。サブスクリプション型の新しいプログラムも提供されたところだ。興味があれば登録しておくといいだろう。
Google Cloud Day ’23 Tour
Google Cloud Dayでは、AI、データの利活用、システムの内製化、生産性向上、コラボレーション、業務効率改善といった、いま、企業で話題のトピックスについて取り上げ、最新情報をお送りします。ぜひ早めの登録をお願いします。
Google Cloud Innovators
Innovatorsプログラムは、すべての Google Cloud 開発者と技術者のための、役立つ情報を共有しあい、活気あふれるメンバーシップ プログラムです。また、Google Cloudに関する学習と成長を加速させるとともに、活躍するメンバーの認知を高めることもできます。開発者、技術者、学生、クラウドの専門家など、どなたでもご参加いただけます。