登壇者
藤門 千明(ふじもん・ちあき)氏
Zホールディングス株式会社 常務執行役員 Co-GCTO(Co-Group CTO/共同グループ最高技術責任者) ヤフー株式会社 取締役 常務執行役員 CTO(最高技術責任者)
2005年に筑波大学大学院を卒業後、ヤフー株式会社に新卒入社。 エンジニアとして「Yahoo! JAPAN ID」や「Yahoo!ショッピング」「ヤフオク!」の決済システム構築などに携わる。決済金融部門のテクニカルディレクターや「Yahoo! JAPAN」を支えるプラットフォームの責任者を経て、2015年にヤフー株式会社CTOに就任。 2019年10月にZホールディングス株式会社 常務執行役員 CTO、ヤフー株式会社 取締役 常務執行役員CTOに就任。2021年3月より現職。
谷口 博基(たにぐち・ひろき)氏
ヤフー株式会社CDO(Chief Data Officer)
東京大学工学系研究科修了後、マッキンゼーに入社し、ハイテク・製造業を中心に日本企業のグローバル化、提携、買収、新規事業開発、R&D戦略など幅広い案件に従事。2013年1月ヤフーに入社し、株式会社一休の買収、Buzzfeed社との合弁事業会社「BuzzFeed Japan株式会社」設立などを担当。2016年より全社横断のデータ部門で本部長を務め、2019年10月、事業者向けデータソリューションサービスを立ち上げる。2021年4月より現職。
データを利活用したAI開発
初日キーノート、まず登場したのは、取締役 常務執行役員 CTOを務める藤門 千明氏だ。
藤門氏は、「AIテックカンパニー」はヤフーだけの目標ではないと言う。その背景には、2021年3月1日、ヤフーの親会社であるZホールディングスがLINEとの経営統合を果たした際に、Co-CEOの2人、川邊 健太郎氏と出澤 剛氏が「日本・アジアから世界をリードするAIテックカンパニーへ」と宣言がある。
10年以上前から、AIを活用しサービス開発に取り組んできたヤフー。「AIテックカンパニー」を目指すヤフーがZホールディングスの中核企業としてリードしていく、藤門氏は力強く決意を語った。
では、なぜヤフーがAIやデータを重要視するのか。そして、その結果何が起こるのか。ヤフーは数多くのサービスやアプリを提供している。その数は約100にもなる。Web検索やニュース、ショッピング、オークションなどでヤフーのサービスを利用しているという方も少なくないだろう。
ヤフーのサービスやアプリの利用によって、ユーザーの行動がログとなり蓄積される。ヤフーはこのデータを、セキュリティやプライバシーに細心の注意を払いながら解析、分析している。その結果を、AIによって、それぞれサービスの機能改善に活かしている。
サービスやアプリの改善後、ユーザーの利用により、さらに多くのデータが集まる。これらのデータをさらに解析や分析することによってAIが改良され、より良いサービスを提供でき、多くのユーザーに利用いただける。この無限のループが続くからこそ、AIとデータが極めて大切だと藤門氏は強調する。
140ペタバイトものビッグデータを活用してAI開発
ヤフーのサービスやアプリを使うユーザーから受け取る検索キーワードなどのリクエスト数は、1日当たりおよそ1,932億に上る。ただ、データとしてはこの状態では非常に扱いにくく、ヤフー全社で一元管理して加工している。ヤフーが日々活用するデータ量は約140ペタバイトにも及ぶ。
これら大量データを活用し、それぞれサービスを改善していく。そして、ヤフーはAI開発のプラットフォームも一元管理している。プラットフォーム上で、レコメンデーションなどのAIモデルが開発されていく。その数は1日当たり約300にもなる。そして、開発したAIをサービスの改善に使う。サービスにモデルが適用される回数は1カ月当たり約1万回に達するそうだ。
ヤフーではサービス作りからデータの加工分析、加えてAIの開発、全て自社で開発をしている。「自社でやり切るためのエンジニア、デザイナーを抱えていて、みんなでこのAIを作っている」と藤門氏は語る。
そして藤門氏は、AIをサービス改善に活用した例を4つ挙げた。1つ目は「Yahoo!ショッピング」。「Yahoo!ショッピング」内の商品検索結果は、ユーザーごとに最適なものを表示している。その結果、商品詳細ページのCTR(Click Through Rate:クリック率)を2桁パーセント引き上げることができた。
2つ目は「汎用レコメンデーションエンジン」。より多くのサービスでレコメンデーション技術を活用するヤフーは、汎用レコメンデーションエンジンを自社で開発している。ユーザーの行動ログをこのレコメンデーションエンジンに蓄積し、多様なアルゴリズムを適用することで、単一のプラットフォームからさまざまなレコメンデーションエンジンを作っている。現在、ヤフーが提供している20以上のサービスでそれを活用しているという。
3つ目は「Yahoo! BEAUTY」で提供するヘアスタイル検索の機能だ。以前はスタイリストがモデルをカットし、カット画像にヘアスタイルを示すタグを付けてアップロードする形で運用していた。しかし、人によるタグ付けでは、検索結果が揺らいでしまうという課題があった。そこで、AIで画像を解析し、特徴量をつかみ、検索結果に反映させるようにした。その結果、検索の精度が17%以上改善されたという。
4つ目は「Yahoo!ニュース」のコメント欄だ。ユーザーがニュースに関する意見や思いを書き込める機能だが、記事とは無関係なコメントや、強い非難、誹謗中傷が含まれるコメントが入ることもある。従来は専門のパトロール部隊を編成し、人の力でコメントを削除、あるいは非表示としていたが、現在はこれをAIで実現しているという。
そこには「Transformer」と呼ばれる、ディープラーニングをベースとした自然言語処理のモデルがある。それを利用し、ヤフーが保有する大量のデータを事前に学習することで、2つの大きなモデルを作っている。1つは記事とコメントの関連度を判定するモデル。もう1つはコメントの不適切度、誹謗中傷になっていないかを判定するモデルだ。この2つのモデルによって、現在は毎月25万件の違反コメントを削除あるいは非表示にしているそうだ。
そして、AIテックカンパニー化に向けて重要な3つの武器として、多くのサービスから生まれる大量のデータ、そしてそのデータから生まれるAIのモデル、そして人財を挙げ、藤門氏は一旦退場した。
「全社員AI人財化」に向けて取り組んでいること
続いて、CDO(Chief Data Officer)を務める谷口 博基氏が登場。谷口氏はまずAIテックカンパニーを実現する上で欠かせない「全社員AI人財化」について語り始めた。「AI人財」と言うと、データサイエンティストのことだけを指すと考える人が多いかもしれない。ヤフーでは「AI人財」には「Type 1」「Type 2」「Type 3」の3種類があるという。
イメージしやすいよう、谷口氏は、Type 1、Type 2、Type 3をAIではなくWeb技術に例えて説明してみせた。Type 1は、Webの世界ではHTMLを書く人であり、HTMLの規格を作る人。Webが広がり始めた頃には、HTMLの技術を理解して自分でHTMLを書かないと情報発信ができないというような時代があった。現在のAIで言えば、データサイエンティストがさまざまなアルゴリズムを駆使してAIを開発している。
Type 2は、Webの世界ではHTMLが分からなくてもWebサイトが作れるような、ツールやサービスを作る人。古くはホームページビルダー、最近で言うと誰でもアプリが作れるヤプリなど、Webを身近な物にしてくれるツールやサービスが登場している。AIの世界でもそのようなツールやサービスを作る人が現れるということだ。
そしてType 3は、Type 2の人が作ったツールやサービスを活用する人。Webで言うと情報発信をしたり、お店を作ったりする層を指す。現代においてはType 2の人が作ったツールやサービスによって、Web人財ならすぐに実現できるというところまで来ている。AIでも、Type 2の人がツールやサービスを作り、それを活用する人も活用にあたって必要な知識をつけていくことで、あらゆる職種、あらゆる業種の人がAIを活用する人、つまりType 3のAI人財になれる可能性がある。
ヤフーは全社員AI人財化に向けた3つの施策を実行している。まずは全社員に対象とした「データ教育」。2つ目は「データアワード」。社内のデータ活用やAI活用の事例を発掘して、それを全社員に発信することを狙ったものだ。3つ目は「Kaggleチャレンジ」。米Kaggleが運営しているデータサイエンスのコンペティションに、ヤフーの従業員にも参加してもらい、優秀な成績を収めたデータサイエンティストを報奨する制度だ。
それぞれ2021年4月以降に始めた新たな施策だが、データ教育は10以上のコースが開始され、受講必須のものについては80%以上の社員がすでに受講しているそうだ。データアワードも、100件以上のエントリーがあった。その中から約10件、入賞作品を決めてすでに全社員に発信している。Kaggleチャレンジも、すでに10名以上の従業員が報奨を受けているという。
ヤフーの従業員全体を見ると、いまのところAI人財でないレイヤーに人財のピークがあると考えているそうだが、これらの施策を実行することで、このピークをType 3以上に移行させることを目指している(下図参照)。
ヤフー社外とのデータ連携も目指す
谷口氏は最後に、ヤフーが考えるデータ活用の未来と、それに向けた道程について語り始めた。ヤフーではデータ活用を3段階で考えている。1段階目は、「Yahoo!ニュース」「ヤフオク!」など、個々のサービスの中に閉じてデータを使うこと。2段階目は、個別のサービスに閉じることなく、サービス間をデータが行き来して、ヤフー全体で活用すること。そして3段階目は、ヤフー社内にデータを閉じず、外部の企業、自治体、学術機関などとの間でデータの活用を進めることだ。
ただ、外部とデータを連携するということは、プライバシーがより大事になる。ここでヤフーが重視している視点が3つある。1つ目は法令遵守。2つ目は同意取得をしっかり行うこと、そして、同意してもらった内容をしっかり守るということ。そして、3つ目は生活者感覚。ユーザー感覚で、自然なことであるかという視点が大切だということ。法令を守っている、同意の内容を守っているから良いというわけでなく、ユーザーの理解をしっかりと得て、支持してもらえるような形でデータ活用を進めることが大切だと考えている。
そしてヤフーは、自社データを統計化したビッグデータを外部の企業や自治体などで活用できるサービスを2019年に開始したデータ・ソリューション事業ですでに展開している。3種類のサービスを提供し、1つ目は誰でもWebブラウザから活用できる分析ツールの「DS.INSIGHT」。ヤフーに蓄積されたデータを活用し、ユーザーの手で課題解決に向けた手を打てるサービスだ。2つ目はヤフーのデータサイエンティストがチームになって、ヤフーのビッグデータを分析することで、顧客企業の課題を解決する「DS.ANALYSIS」。3つ目は顧客のシステムやツールにAPIを通して直接ヤフーのビッグデータを供給する「DS.API」だ。
谷口氏はこのように、外部の企業、自治体、学術機関などにデータの価値を届け、データ活用を通して、日本全体を元気にしていきたいと決意を語り、藤門氏にバトンタッチした。
強く後押ししてくれる「あの人」
入れ替わりで現れたのは藤門氏。スライドには「未来は想像するものではなくて、創るもの」という言葉が映し出されている。この言葉はこれまでのYahoo! JAPAN Tech Conferenceでも発信しており、ヤフーのAI開発の背景にある思いだという。つまり、未来を予想するのではなく、未来はこうあるべきだと強く思って自らの手で作り上げてきた。
3年前には、ヤフーで機械学習やAIのために使用するコンピューティングパワーがどうしても足りないという事態に陥った。このときヤフーは、自社でスーパーコンピューター「kukai」を開発することで問題を乗り越えた。
2年前には、もの作りのモダン化、モダナイゼーションの話をしている。AIのモデルを作ったらサービスにいち早く適用したい、ユーザーに使ってもらって始めて価値になるのだからという思いから、いち早くものづくりができて、デプロイされる世界を作っていった。
とはいえ、「未来を創る」ことは大変難しく、厳しいものだ。ここで、グループのトップである孫正義氏が強く後押ししてくれたという。孫氏は、3年前のヤフーの全社員参加型ミーティングで「情報革命の最先端の波が十年に一回ぐらい必ずやってくる」「今一番大きな革命が来ている、それはAI革命」と従業員に発破をかけた。さらに、「生産性を問われるもののほとんどのテーマはAIがぶち抜いていく。AIはこれからのすべての産業を再定義する。だから俺はAIに投資するんだ」と熱っぽく語った。加えて孫氏は、ヤフーのエンジニアに「AI以外全部忘れろ、AIだけやっていけば大丈夫だ」と声をかけた。そのような背景もあり、いまのヤフーがある。
最後に、次回のYahoo! JAPAN Tech Conferenceは、経営統合したLINEと共催という形で、より充実した内容にしていく予定と告知し、初日のキーノートを終了した。
参考リンク
- Yahoo! JAPAN Tech Conferenceについて:「Yahoo! JAPAN Tech Conference 2022」
- 動画アーカイブ
- SlideShareアーカイブ