ビッグデータを駆使するデータドリブン企業を目指す
「Yahoo! JAPAN」は2016年4月に20周年を迎えた。サービス開始当初の月間ページビューは約30万だったが、現在は600億以上と、多くのユーザーが利用するWebサイトに成長した。事業面でもサービス開始以来、増収増益が続いている。さらに、インターネット企業の時価総額をグローバルで見るとYahoo! JAPANは18位と言われており、日本国内のインターネット企業では最も高くなっている。
ユーザー数に目を向けると、2016年の実績は1日あたり約9000万ユニークブラウザ(サービスの訪問者数をブラウザ単位で集計した値)であり、多くの人々が使っていることがうかがえる。
Yahoo! JAPANは創業時からの主力サービスである検索だけでなく、複数の領域にまたがる事業を展開していることに特徴がある。例を挙げると、メディアサービスの「Yahoo!ニュース」や「Yahoo!知恵袋」、eコマースサービスの「Yahoo!ショッピング」や「ヤフオク!」、そして、決済サービスの「Yahoo!ウォレット」や「Yahoo! JAPANカード(クレジットカード)」などだ。このような、多岐にわたる事業領域において、有力なサービスを複数抱える企業は世界的にも珍しいという。
しかし吉野氏は、「私たち(Yahoo! JAPAN)はもっと人々や社会の課題を解決していきたいと思っている」と、語る。そのために、インターネットでサービスを展開する「ネット企業」から、さらに発展した「データドリブン企業」へ変わっていきたいという強い思いがあるという。
最近は、「AI」や「ディープラーニング」「シンギュラリティ」などがホットなワードとなっており、状況次第では産業革命に匹敵する影響を世の中におよぼすといわれている。「AIを作っていく中で、最も重要なのはデータ」と、吉野氏は解説する。なぜなら、データを入力して学習させなければ、AIの認知能力が向上することもないからだ。そのため、AIを扱うのであれば、ビッグデータについても併せて考える必要がある。
Yahoo! JAPANはこのビックデータを最大の強みにしていきたいと考えている。先述した通り、Yahoo! JAPANのサービス領域は多岐にわたる。つまり、マルチなデータセットを持っているということである。
Yahoo! JAPANの多様なサービスをユーザーが利用するとデータが貯まる。AIなどを駆使してそのデータから気づきを得る。さらに気づきからサービスを改善したり、新しい機能を提供したりすることで、より多くの人に使ってもらえる。その結果、さらに多くのデータが集まる――このサイクルはデータ=エコシステムの源泉となり、「無限の再帰性」を生み出す可能性を秘めている。吉野氏は「このようにデータから得た気づきを最大限に活用して、Yahoo! JAPANにしかできない提案・サービスを提供していきたい」と、語った。
では、「ビッグデータの無限の再帰性」を生むためには、どのようなポイントがあるのだろうか? 吉野氏は、自身の専門でもあるデータを、いかに効率よく運用していくかに注目し、次のように解説した。
現在のYahoo! JAPANは、月間で約674億(2016年10-12月の平均)のページビューがある。これらの膨大なアクセスデータを保持するプラットフォームにはHadoopやRDB、NoSQL、Object Strage(社内で管理しているクラウドストレージ)、DWH(データウェアハウス)などが使用されている。その中でも、Hadoopには7000ノード/150ペタバイトという膨大なデータが蓄積されている。
また、Yahoo! JAPANはオープンソースの活用を進めており、2015年からは米国のHortonworks社との共同開発を実施している。さらに、2016年には技術力のさらなる強化を目的として、シリコンバレーに拠点を開設した。
吉野氏は「データを蓄積するプラットフォームは充実している。これからは、増え続けるボリュームに対してどこまで価値を引き出し、サービスに生かしていけるか――投資した分どれだけリターンがあるのか、考慮しないといけない段階に入ってきている」と、語る。
そこで重要となるのが、プラットフォーム管理にとどまらない、データそのもののマネジメントだ。吉野氏は続けて、「データは資産なので、その資産価値を最大化する活動をしなくてはいけない。それがデータマネジメントだ、という定義をしたい」と、述べた。