「見える化の先」を示すYahoo! JAPANの多彩で膨大なデータ
尾崎氏は、まず「見える化の先」というキーワードを挙げる。これまでもデータの可視化は多くの企業で試みられてきたが、多くの場合「見える化」自体が目的となり、肝心の獲得目標が不明確なままというケースも少なくなかった。
「目的が定まってこそ、何を『見える化』するかも決まる。私たちは、見える化した後にどうすればデータ活用につながるかを考え、“見える化の先”にチャレンジしている」
この取り組みを支えるデータの源泉は、Yahoo! JAPANの持つビッグデータだ。現在Yahoo! JAPANでは、100を超えるサービスが提供されている。1日当たりのユニークブラウザ数9104万、月間ページビュー725億、月間アクティブユーザーIDが3970万という数字を見るだけでもその規模感が伝わってくる。
膨大なデータ量だけではない。Yahoo! JAPANのサービス分野は、検索、EC、金融、メッセージングサービス、地図やカーナビなど多岐にわたり、そこから入ってくるデータも実に多種多様だ。尾崎氏は、「1つの会社でこれだけ多彩な情報が入ってくるのは、世界でも珍しい。これらの情報を、私たちはマルチビッグデータと呼んでいる」と語る。
どこにどんなデータがあるのか? データの見える化ツールを作成
すでにYahoo! JAPANでは、マルチビッグデータ活用の新しい試みを行っている。例えば、Yahoo!ニュースでは、タイムラインのクリック履歴だけでなく検索クエリをもとに「おすすめ記事」を表示することで、利用者数を増やすことに成功した。
また過去の購入履歴に基づいてレコメンド商品を提示する手法は多くのECサイトが採り入れているが、Yahoo!ショッピングではこれまで購入履歴のない人でも、Yahoo! JAPANの検索を利用したことがあれば、そこでの検索クエリをもとにおすすめ商品を提案する機能も提供している。
「この他にも広告などいろいろな活用事例があって、今後はこれをさらにスケールさせていきたいと考えている。だがそれにはいくつかの、現在目の前にある阻害要因を取り除いていかなくてはならない」
その阻害要因とは、「他のサービスがどんなデータを持っているかわからないこと」だと尾崎氏は指摘する。100を超えるサービスと6000人を超える社員を擁するYahoo! JAPANでは、自社の保有するデータがあまりに大量で、自分の担当部署以外にどんなデータが存在しているのか把握することは容易でない。
「そこで、まずはデータの見える化をしようと決め、そのためのツール開発に着手した。イメージとしては、図のようにデータをカテゴリに分類し、そこから必要なカテゴリを選択すると、そこに属するデータの一覧が表示され、必要なデータをクリックすると詳細な内容が表示されるといった仕組みを作ってみた」
ビジネス側も含めた全社を巻き込んでデータをビジネスにつなげる
尾崎氏は、見える化ツールを作成するにあたって、まず基本となるデータ活用の流れを考えた。その流れとは、以下のようなステップだ。
- データを知る
- 企画する
- 活用する
「とはいうものの、現状はどこにどんなデータがあるのか? 見つけたとしても使ってよいのか? いくつもの壁が存在して、なかなか企画までたどり着けない。この問題を解決するためにも、見える化ツールを使って、データの所在や使用の可否を明確にできれば、企画を出す人も増えると確信した」
こうしたツールのユーザーといえば、従来はエンジニアやアナリストなどの専門家がほとんどだった。だが尾崎氏は、「ビジネス側~営業職や企画職の人々にこそ、大いに使ってほしい。また技術者側も、データアナリストだけでなくすべてのエンジニアに使ってほしい」と強調する。
自分が興味のあるデータがどこにあるかをすぐに発見し、気軽に引き出して検討できる環境があれば、結果的に企画の数も増えていくはずだ。今回の見える化ツールは、企画を考える人の母数を飛躍的に増やす重要な役割を担っている。
「データから価値を引き出すためには機械学習などの知識も必要だし、サービスに実装する開発力も必要だ。さらにそのサービスをビジネスの課題解決に生かすには、営業や財務などの知識や経験が欠かせない。社内の各分野の知見を集めるためにも、誰もがデータを気軽に共有・検討できる環境が不可欠だった」
将来のビジネスにデータ活用を考える文化を育てていこう
今回の見える化ツールの開発にあたっては、いくつかの課題があったと尾崎氏は振り返る。中でも重要だったのが、「ビジネス(営業、企画職)の人にも、もっとデータを知ってもらうためにはどうすればよいか?」だった。
特に営業職の人などは、データやデータベースの基本的な知識を持っていない。このためエンジニアが技術用語を使って説明しても、理解してもらえないことがほとんどだ。そこで考えついたのが「レストランのメニュー」だと尾崎氏は言う。
「レストランのメニューは、初めて来たお客さんでも、料理名や値段、素材、調理方法などを見れば、どんな料理かわかるように作られている。データ活用においても同様に、データ名やデータ項目、データ説明、そして活用事例などを明示して、自分の見たいデータを選べるように設計を工夫した」
もう1つの重要課題は、「膨大なデータ情報をどうやって集めるのか?」だ。社内には構造化データから非構造化データ、半構造化データなど、さまざまなデータが大量にある。これらを効率的に収集・活用するために、尾崎氏は社内で議論を重ね、データの分類や階層分けなどの基準作りを進めた。その際もっとも重要なキーワードが、「価値が高いデータから収集する」だったという。
「そこでYahoo! JAPANの膨大なデータの中から、『これは重要なので、集めて活用するべき』データの項目を定義して、『データ収集方針』として社内に周知した。こうして標準化していった結果、各部署や組織が自分たちのデータの中から該当するものを選定して優先的に登録することでデータ取集を効率化させた」
こうして集めたデータをもとに、具体的な活用アイデアを出すためのフレームワークの整備なども並行して進めてきた。
「『どんな情報があれば、活用アイデアが生まれるのか?』といった課題もあった。データがありさえすればいいわけではない」
フレームワークの例として尾崎氏は、ホテルの予約サイトに入力された宿泊者情報からのアイデア出しを挙げた。この情報から、「ショッピングで子供用品をオススメする」といったアイデアが生まれるという。そのステップは、下の図の通りだ。
「この過程で、コンテキストリーディングが必要になる。ホテル予約時に入力する宿泊者名、人数構成などの情報から、『子供の人数を入力した人には、子供がいるだろう』と予測をして、そこからアイデアは生まれる。しかし、いきなりこの間を埋めるのは難易度が高いだろう」
そこで、尾崎氏はコンテキストリーディングのステップを省略できるよう、「何がわかるデータなのか」明示したタグを、データにひも付けた。この例でいえば、宿泊者情報に「子供がいる親かわかるデータ」とタグ付けすることで、「ショッピングで子供用品をオススメする」アイデアにたどり着きやすくなる。また反対に、「ショッピングで子供商品をオススメしたい」といった課題から、「ホテルの予約サイトに入力された情報を活用しよう」と考えつくのは難しいが、タグが付いていれば使えるデータをすぐに探すことができる。
以上のように課題を乗り越えて、データ活用の文化を根付かせる活動を進めている尾崎氏。最後に、今後の展望を語った。
「見える化ツールや、データ収集方針の発表後、いろいろな人の助けを得て社内での認知度はかなり上がってきた。今後は集めたデータ登録の効率化や、キラーコンテンツにつながる、価値の高いデータ創出といった視点からも取り組んでいきたい」
具体的にはデータ活用のアイデア出しのワークショップや、アイデアを活用につなげるスキーム作りを通じて、データ活用を考える文化を社内に醸成していきたいと尾崎氏は力強く語り、セッションを終了した。