One-Shot Learning技術にはグーグル・アマゾン以外の企業にもチャンスをもたらす可能性
巣籠:個人的な質問でもあるのですが、人工知能やディープラーニングに関する論文が、毎日のように公開されています。これらの情報はどのようにキャッチアップしているのですか。
ソーチャー:本当に情報は多いですよね(笑)。以前は機械学習、自然言語処理、画像認識といったキーワードをチェックし、年間6回程度の大きなカンファレンスにでていればよかったのですが、今はそんなカンファレンスは毎週のように行われています。情報スピードもどんどん上がっています。メーリングリストなども購読していますが、全部のチェックはもはや不可能です。
代わりに、ソーシャルネットワークをうまく活用するようにしています。研究者仲間や、この分野の情報をフィルタリングしてくれている人、新しい論文の概要をうまくまとめて発信してくれる人など、コミュニティの存在は大きいです。このようなリサーチグループ、コミュニティはオープンですし、最先端の人の意見にも接することができ、ツールなども共有できます。
巣籠:「One-Shot Learning」についてお聞きします。少ないデータでも学習が可能とされるこの技術は、グーグルやアマゾンのようなビッグデータを持っていないスタートアップにもチャンスになるのではないかと考えていますが、どうでしょうか。
ソーチャー:私も非常に興味を持っています。One-Shot Learning、もっといえばZero-Shot Learningの研究は、質問を想定して大量のデータを用意しなくても、どんな質問にも答えることができるAIにつながります。現在、私が最終的に目指しているのは「Joint Many Task Learning」という、単一のモデルでさまざまな質問に答えを出すことができるAIです。
巣籠: まさに「ノーフリーランチ定理[2]」への挑戦といえるものですね。自分も協力できたらと思います。
注
[2]: どんなに性能がよく見える探索アルゴリズムも、解くべき問題の全体集合の中でみた場合、平均性能は実はどれも同じであるということを示す定理。汎用的な人工知能を実現するのは困難であることを意味する。
AI有効活用のツボはワークフロー全体のチューニングにあり
巣籠:話は変わるのですが、自分は学生のときに「Gunosy」というニュースキュレーションアプリを開発しました。SNSの活動からその人にあったニュースをレコメンドするというテキストマイニングを応用したシステムです。このサービスを提供していて、技術的にはレコメンドの精度は上がっているのに、ユーザーからはニュースが偏りすぎてつまらないという声を聞くことがありました。ソーチャーさんは、研究結果をアプリやサービスに落とし込むとき、このようなギャップをどのように埋めるようにしているのでしょうか。
ソーチャー:とてもよい質問ですね。先ほどお話しした3つ要素のうち、ワークフローの統合にかかわる問題だと思います。AIモデルをワークフローに統合したら、それを継続的に改善していく作業も必要です。
私は、必要なら前の段階に戻すこともあると思っています。精度が上がったのに「つまらない」と言われてしまう。似たような問題は米国でもあります。フィルターバブルと呼んでいますが、フィルターをかけすぎて結果が固定化されてしまう。ユーザーに対して決めつけすぎてしまうという問題です。
このような問題が起きるのは、データセットに問題があると思います。より現実的なユースケースになっていないわけです。ABテストなどでユーザーのフィードバックを得るなどして、適切なテストセットを常に用意しておくのも重要と考えます。
巣籠:Einsteinでは、まさに多数のフィードバックがあるかと思います。それをAIの改善に取り入れることで、よりよいモデルになるということですね。
ソーチャー:そのとおりです。前述のPredictive Lead ScoringやOpptunity Insightsといった技術は、毎日更新されています。ユーザーのクリックや導線だけでなく、実際どれだけリードが増えたか、機会や行動にどれだけ結びついたか、さまざまなフィードバックデータを活用しています。この取り組みによって売上が30%も上がったという実績もあります。多言語対応など今後の課題もありますが、Einsteinは日々の進化を続けています。