AIの社会実装に向けてヤフーが取り組んでいること
次に、登場したのはYahoo! JAPAN研究所 所長、テックラボ本部長を務める田島 玲氏だ。田島氏は研究開発として最先端の技術をいかに使いこなしていくか、そして、生み出していくかについて話を始めた。
まずはZホールディングス全体の取り組みの話から紹介する。AIの社会実装を進めていくうえで非常に重要な要素に「AI倫理」がある。Zホールディングスは2021年6月、AI倫理に関する有識者会議を立ち上げた。有識者会議によって、外部の有識者の意見を踏まえ、倫理に関する基本方針を明確化し、そのうえでガバナンスやルールを整備していく方向だ。
さらに田島氏は、Zホールディングス全体での取り組みとしてもう一つ、2021年に開始したAI人材が集まり共に学ぶ場「Z AIアカデミア」を挙げた。具体的には、文系のバックグラウンドの人材も含めて、AIのリテラシーを底上げしていくための講座を開講している。さらに、AIを作る側の人材が集まって事例を共有する、あるいはお互いに刺激し合ってレベルを上げていくことにも取り組んでいる。
田島氏は続いて、ヤフー単体としての取り組みへと話を進めた。まずは「サイエンスシェア会」。技術を追いかけるだけではなく、どういった技術をどこでどのように使っていくのかという事例の共有が重要だと説明し、そのために立ち上げたと語る。「Z AIアカデミア」にも似たような取り組みはあるが、「サイエンスシェア会」はいち企業の中での取り組みであるため、より具体的な数字を共有し、突っ込んだ議論ができているという。
さらに、一堂に会して議論する場として、ポスターセッションを開催しているそうだ。ほかにも論文を読む会や勉強会などは草の根で多数開催されている。加えて、大学との共同研究を多数推進し、実際にこの取り組みの中から、サービスの現場で使われるような成果も出てきているそうだ。
前半の塚本氏の話にもあったが、外部への論文発信にも力を入れ、特にトップカンファレンスと言われるような狭き門への挑戦は続けており、近年は大きな成果も上がるようになってきた。AIは動きが激しい領域であるため「ヤフーが世界に向けて発信する側に回る」といった気概で取り組んでいるという。
外部との協業で勝ち取った貴重な成果
そして最後に、研究開発の具体的な事例として1本の論文を紹介した。「Doubly Robust Off-Policy Evaluation for Ranking Policies under the Cascade Behavior Model」という論文だ。WSDM(ウィズダム)というWeb系のトップカンファレンスで採択され、イェール大学成田准教授や学生インターンとの協業の成果だという。実は、この論文のテーマ自体が、AIの社会実装に向けて非常に重要なトピックとなっている(参考記事:「Webデータマイニングのトップカンファレンス「WSDM」にて共著論文採択」)。
AIは「データのバイアスとの戦い」の側面が強い。例えば「CEOの画像」を検索すると、ネクタイを締めた白人の中年男性の写真が大量に表示される。そのような偏ったデータを元に学習すると、AIの挙動も偏ったものになる。結果的にそれが倫理的な問題につながってしまうこともあるはずだ。
一方で、データのバイアスは社会に起因するのみならず、AIの実装自体に起因することもある。田島氏は、「フィルターバブルのようなものを考えてほしい」と語りかける。何らかの施策を打つと、そこで集まったデータをもとにAIのモデルを再学習してさらに施策を打つ。それを何度も繰り返していくと、データ自体、そしてAIのモデルも偏ったものになりうるのだ。
そこで、今回採択された論文で取り上げている「Off-Policy Evaluation(オフポリシーエバリュエーション)」が効果を発揮する。これは、既存のロジックで配信されたログ、すなわちバイアスのあるログを使って新しいロジックの性能を正しく評価する取り組みだ。これができると、効率よくPDCAを正しく回してAIを磨き込んでいくことができるようになる。
ここで反実仮想「counterfactual(カウンターファクチュアル)」という概念が田島氏より紹介される。ログには、「それぞれのユーザーに対してレコメンドをしたか否か」の実績しか残っていない。しかし、施策を評価するために欲しいのは「レコメンドをしたユーザーに対して、もしレコメンドしなかったらどうだったのか」というデータだ。
あるユーザーに「レコメンドを出したことによって何かを買ってもらえた」ということがあったと仮定し、それがレコメンドを出したから買ってもらえたのか、それとも出さなくても買ってもらえたのかについて比較したい。しかし、データとしてはどちらか片方しかないという難しい状況にどのように対処していくか。そこは、近年社会科学で発展してきた「統計的因果推論」という技術がAI領域でも使われるようになってきているという。
そのうちの一つが「Doubly Robust(ダブリーロバスト)」という手法だ。スライド内の「レコメンド有り」、「レコメンド無し」。その左右で比較したい時、データとしてはどちらか片方しかないという状況である。そこへの対処方としては、2つあるという。1つは欠けている方のデータを、機械学習を使って予測していく方法。もう1つは、まずは表の縦方向で集計してしまって、その上で左右を比べる。その際に行ごとに重み付けを変えていくことでバイアスの影響を軽減するやり方だ。
田島氏はこれら2つの手法について、それぞれ一長一短があると指摘する。そして、その点をうまく組み合わせたのがダブリーロバストという手法だという。この論文は、ダブリーロバストをランキング、すなわちリストの評価に適用している。
Webサービスにおいては、検索結果や、レコメンドなど1つだけではなく複数の結果を出すことがよくある。このとき、あるアイテムについて評価したいときに、周囲に何を掲出していたのかが影響する。しかし、すべてのアイテムの影響を考慮に入れてしまうと、非常に複雑になる。そこである程度簡略化し、ユーザーは上から順番に見ていくと想定して、あるアイテムについては、それよりも上に出ているアイテムの影響だけを受けるという考え方が「カスケードモデル」だ。カスケードモデルを前提としたランキングの評価について、ダブリーロバストという手法をどのように適用するのかがこの論文の主たる提案内容だと説明した。
最後に田島氏から、「Yahoo! JAPAN Tech Conference 2022」2日間のキーノートのふりかえり、そして続くセッションについて紹介し、Day2のキーノートは終了した。