SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

【デブサミ関西2017】セッションレポート(PR)

ビッグデータ活用の鍵を握るのは、ビジネス部門を巻き込んだ「見える化」――Yahoo! JAPANの活用事例に学ぶ【デブサミ関西2017】

【C-2】データの見える化で進めるデータドリブンカンパニー

  • このエントリーをはてなブックマークに追加

 世界的にビッグデータの活用が叫ばれる中、「マルチビッグデータドリブンカンパニー」を名乗り、多種多様なデータをビジネスに活用する取り組みを進めるYahoo! JAPAN。すでに同社では「パーソナライズ化」や「レコメンド」などにおいてデータ活用を進めてきた。だが、今後の発展には、一部のエンジニアだけでなく、営業や企画職といったビジネス部門を含むすべての社員がデータの存在を知り、それをもとにアイデアを出し合う仕組みが必要だと考えた。そこで、誰もが膨大なデータの中から必要な情報を抜き出してわかりやすく伝え、新たな企画立案につなげられる「データ見える化ツール」を開発。社内での利用者が増えるにつれ、データをもとにした新しいサービス・ソリューション創出のサイクルを生み出すことが目的だ。同社データ&サイエンスソリューション統括本部 データサービス本部 尾崎弘宗氏が語った。

  • このエントリーをはてなブックマークに追加
ヤフー株式会社 データ&サイエンスソリューション統括本部 データサービス本部 尾崎弘宗氏
ヤフー株式会社 データ&サイエンスソリューション統括本部 データサービス本部 尾崎弘宗氏

「見える化の先」を示すYahoo! JAPANの多彩で膨大なデータ

 尾崎氏は、まず「見える化の先」というキーワードを挙げる。これまでもデータの可視化は多くの企業で試みられてきたが、多くの場合「見える化」自体が目的となり、肝心の獲得目標が不明確なままというケースも少なくなかった。

 「目的が定まってこそ、何を『見える化』するかも決まる。私たちは、見える化した後にどうすればデータ活用につながるかを考え、“見える化の先”にチャレンジしている」

 この取り組みを支えるデータの源泉は、Yahoo! JAPANの持つビッグデータだ。現在Yahoo! JAPANでは、100を超えるサービスが提供されている。1日当たりのユニークブラウザ数9104万、月間ページビュー725億、月間アクティブユーザーIDが3970万という数字を見るだけでもその規模感が伝わってくる。

 膨大なデータ量だけではない。Yahoo! JAPANのサービス分野は、検索、EC、金融、メッセージングサービス、地図やカーナビなど多岐にわたり、そこから入ってくるデータも実に多種多様だ。尾崎氏は、「1つの会社でこれだけ多彩な情報が入ってくるのは、世界でも珍しい。これらの情報を、私たちはマルチビッグデータと呼んでいる」と語る。

さまざまな領域から集まるマルチビッグデータは、Yahoo! Japanならではの貴重な情報資源
さまざまな領域から集まるマルチビッグデータは、Yahoo! JAPANならではの貴重な情報資源

どこにどんなデータがあるのか? データの見える化ツールを作成

 すでにYahoo! JAPANでは、マルチビッグデータ活用の新しい試みを行っている。例えば、Yahoo!ニュースでは、タイムラインのクリック履歴だけでなく検索クエリをもとに「おすすめ記事」を表示することで、利用者数を増やすことに成功した。

 また過去の購入履歴に基づいてレコメンド商品を提示する手法は多くのECサイトが採り入れているが、Yahoo!ショッピングではこれまで購入履歴のない人でも、Yahoo! JAPANの検索を利用したことがあれば、そこでの検索クエリをもとにおすすめ商品を提案する機能も提供している。

 「この他にも広告などいろいろな活用事例があって、今後はこれをさらにスケールさせていきたいと考えている。だがそれにはいくつかの、現在目の前にある阻害要因を取り除いていかなくてはならない」

 その阻害要因とは、「他のサービスがどんなデータを持っているかわからないこと」だと尾崎氏は指摘する。100を超えるサービスと6000人を超える社員を擁するYahoo! JAPANでは、自社の保有するデータがあまりに大量で、自分の担当部署以外にどんなデータが存在しているのか把握することは容易でない。

 「そこで、まずはデータの見える化をしようと決め、そのためのツール開発に着手した。イメージとしては、図のようにデータをカテゴリに分類し、そこから必要なカテゴリを選択すると、そこに属するデータの一覧が表示され、必要なデータをクリックすると詳細な内容が表示されるといった仕組みを作ってみた」

大きなカテゴリから具体的な項目へ絞り込んでいくことで、必要なデータの詳細情報までたどり着ける
大きなカテゴリから具体的な項目へ絞り込んでいくことで、必要なデータの詳細情報までたどり着ける

ビジネス側も含めた全社を巻き込んでデータをビジネスにつなげる

 尾崎氏は、見える化ツールを作成するにあたって、まず基本となるデータ活用の流れを考えた。その流れとは、以下のようなステップだ。

  1. データを知る
  2. 企画する
  3. 活用する

 「とはいうものの、現状はどこにどんなデータがあるのか? 見つけたとしても使ってよいのか? いくつもの壁が存在して、なかなか企画までたどり着けない。この問題を解決するためにも、見える化ツールを使って、データの所在や使用の可否を明確にできれば、企画を出す人も増えると確信した」

 こうしたツールのユーザーといえば、従来はエンジニアやアナリストなどの専門家がほとんどだった。だが尾崎氏は、「ビジネス側~営業職や企画職の人々にこそ、大いに使ってほしい。また技術者側も、データアナリストだけでなくすべてのエンジニアに使ってほしい」と強調する。

 自分が興味のあるデータがどこにあるかをすぐに発見し、気軽に引き出して検討できる環境があれば、結果的に企画の数も増えていくはずだ。今回の見える化ツールは、企画を考える人の母数を飛躍的に増やす重要な役割を担っている。

 「データから価値を引き出すためには機械学習などの知識も必要だし、サービスに実装する開発力も必要だ。さらにそのサービスをビジネスの課題解決に生かすには、営業や財務などの知識や経験が欠かせない。社内の各分野の知見を集めるためにも、誰もがデータを気軽に共有・検討できる環境が不可欠だった」

技術者だけでなくビジネスの現場を知る人々を巻き込むことで、データ活用の可能性をさらに広げることができる
技術者だけでなくビジネスの現場を知る人々を巻き込むことで、データ活用の可能性をさらに広げることができる

将来のビジネスにデータ活用を考える文化を育てていこう

 今回の見える化ツールの開発にあたっては、いくつかの課題があったと尾崎氏は振り返る。中でも重要だったのが、「ビジネス(営業、企画職)の人にも、もっとデータを知ってもらうためにはどうすればよいか?」だった。

 特に営業職の人などは、データやデータベースの基本的な知識を持っていない。このためエンジニアが技術用語を使って説明しても、理解してもらえないことがほとんどだ。そこで考えついたのが「レストランのメニュー」だと尾崎氏は言う。

 「レストランのメニューは、初めて来たお客さんでも、料理名や値段、素材、調理方法などを見れば、どんな料理かわかるように作られている。データ活用においても同様に、データ名やデータ項目、データ説明、そして活用事例などを明示して、自分の見たいデータを選べるように設計を工夫した」

レストランのメニューを見るように、ユーザーはデータ属性から、自分の欲しいデータかどうかを判断できる
レストランのメニューを見るように、ユーザーはデータ属性から、自分の欲しいデータかどうかを判断できる

 もう1つの重要課題は、「膨大なデータ情報をどうやって集めるのか?」だ。社内には構造化データから非構造化データ、半構造化データなど、さまざまなデータが大量にある。これらを効率的に収集・活用するために、尾崎氏は社内で議論を重ね、データの分類や階層分けなどの基準作りを進めた。その際もっとも重要なキーワードが、「価値が高いデータから収集する」だったという。

 「そこでYahoo! JAPANの膨大なデータの中から、『これは重要なので、集めて活用するべき』データの項目を定義して、『データ収集方針』として社内に周知した。こうして標準化していった結果、各部署や組織が自分たちのデータの中から該当するものを選定して優先的に登録することでデータ取集を効率化させた」

 こうして集めたデータをもとに、具体的な活用アイデアを出すためのフレームワークの整備なども並行して進めてきた。

 「『どんな情報があれば、活用アイデアが生まれるのか?』といった課題もあった。データがありさえすればいいわけではない」

 フレームワークの例として尾崎氏は、ホテルの予約サイトに入力された宿泊者情報からのアイデア出しを挙げた。この情報から、「ショッピングで子供用品をオススメする」といったアイデアが生まれるという。そのステップは、下の図の通りだ。

宿泊者情報から「ショッピングで子供用品をオススメする」アイデアに至るまでのステップ
宿泊者情報から「ショッピングで子供用品をオススメする」アイデアに至るまでのステップ

 「この過程で、コンテキストリーディングが必要になる。ホテル予約時に入力する宿泊者名、人数構成などの情報から、『子供の人数を入力した人には、子供がいるだろう』と予測をして、そこからアイデアは生まれる。しかし、いきなりこの間を埋めるのは難易度が高いだろう」

 そこで、尾崎氏はコンテキストリーディングのステップを省略できるよう、「何がわかるデータなのか」明示したタグを、データにひも付けた。この例でいえば、宿泊者情報に「子供がいる親かわかるデータ」とタグ付けすることで、「ショッピングで子供用品をオススメする」アイデアにたどり着きやすくなる。また反対に、「ショッピングで子供商品をオススメしたい」といった課題から、「ホテルの予約サイトに入力された情報を活用しよう」と考えつくのは難しいが、タグが付いていれば使えるデータをすぐに探すことができる。

 以上のように課題を乗り越えて、データ活用の文化を根付かせる活動を進めている尾崎氏。最後に、今後の展望を語った。

 「見える化ツールや、データ収集方針の発表後、いろいろな人の助けを得て社内での認知度はかなり上がってきた。今後は集めたデータ登録の効率化や、キラーコンテンツにつながる、価値の高いデータ創出といった視点からも取り組んでいきたい」

 具体的にはデータ活用のアイデア出しのワークショップや、アイデアを活用につなげるスキーム作りを通じて、データ活用を考える文化を社内に醸成していきたいと尾崎氏は力強く語り、セッションを終了した。

お問い合わせ

この記事は参考になりましたか?

  • このエントリーをはてなブックマークに追加

この記事は参考になりましたか?

この記事をシェア

  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/10439 2017/10/02 14:00

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング