データ活用がうまくいくためにはボトルネックの把握を
米マイクロソフトが米ニューヨークで日本時間の11月16日0時より開催した「Connect();」。翌17日、そこで発表した内容を日本のエンジニアに向けて報告するオンサイトイベント「Connect(); Japan 2017」が東京ミッドタウンで開催された。1日限定の同イベントでは、App Service、Azure DB for MySQL/PostgreSQL、Visual Studioなどの各製品のアップデート情報を含めた最新の開発エクスペリエンスが紹介された。
本イベントはデータビークルの創業者であり取締役副社長を務める西内氏による特別講演「ビッグデータ時代における活用戦略」から始まった。
データビークルは「みんなの手にデータサイエンスを」を目指し、データ活用を目指すシチズンデータサイエンティストを支援する製品・サービスを提供している。同社には「こういうデータはあるが、どこからどう手をつけていいかわからない」「手をつけてみたが、うまくいかなかった。どうすればよいのか」という相談が大量にくるという。
データがうまく活用できる組織の理想は、良い分析ができ、その分析結果を見て行動方針と行動指示する意思決定ができる。さらにその決定に基づき実際に現場が行動し、その結果どういう良い結果が生まれたのか、データを取得して整備し、それをまた分析につなげていく。「こういう仕組みが理想だが、現実にこれができている企業はほとんどない」と西内氏は指摘する。というのもデータそのものが利用困難だったり、高度だが無意味な分析をしていたり、意思決定者が集計止まりで分析結果を生かせなかったり、またしっかり意思決定をしても現場のリソースが足りなくて混乱したりしているからだ。
なぜデータが使えないのか。分析用データでは一人に対して一つのレコードにすることが大事だが、顧客マスターと購買履歴データでは顧客IDが不統一であったり、表記の揺れがあったり、欠損や異常値などがあったりするからだ。データ分析で問題なのは、「どんな集計をしてどんな変数を取得すれば良いのかなどは、センスに依存してしまうこと」と西内氏は言う。素晴らしいセンスのあるデータサイエンティストがいればよいが、そういう人がいないとどう変数を作って分析すれば良いかが分からない。業務が分かっている担当者にヒアリングするのだが、仮説を聞いて分析しても、仮説と同じなら「ふーん」という反応で終わり。異なった結果の場合は「もう一度分析してみて」と言われてしまうという。
また、高度で無意味な分析をしていることも多い。例えば機械学習やディープラーニングを使って、行動履歴からこの人が今後優良顧客になる確率が11%と予測できたとしても、「その確率をより上げることや優良顧客度合いを上げる方法を問われると答えられず、アクションにつながらないことが多い」と西内氏は語る。
意思決定はツールでは解決できない
これらの課題はツールで解決できるが、ツールでも解決できないのが「意思決定だ」と指摘する。そこが一番のボトルネックだと言うのである。つまり課題設定がうまくいかないのだ。「何についてのどの指標を最大/最小にすべきかという課題を設定すること」と西内氏は力強く語る。
そのためにまず考えるのはアウトカムと解析単位だという。アウトカムとは売上や在庫コストなどの望ましさを具体的に定義すること。解析単位とは望ましさを比べる単位(顧客、従業員、商品)である。価値ある分析のイメージは顧客心理や従業員能力、製品スペックなどのデータを活用し、「こういう顧客がターゲットになる」「こういうスタッフは営業として伸びやすい」「こういうスペックの商品は在庫として残りにくい」ということを導き出すことである。そうすることで、アウトカムが改善でき、データ分析の活用が進むことになる。
同社が提供するデータサイエンス支援ツール「Data Diver」は、この2つのポイントさえわかれば、容易に施策につながる分析結果が得られるツールとなっている。プログラミングも不要で、要件設定なども容易にできるようになっている。結果も超高速で出力される。もちろん、データ分析に欠かせないデータ整備を自動化するツールも同社では提供している。つまりデータビークルのツールを使えば、業務データベースから分析用データを自動生成するだけではなく顧客ごと、商品ごと、スタッフごとなど目的に応じて、分析データを自動生成する。センスに頼ることなく多様な変数を作り出すことができるのである。実際にどれぐらいに簡単に分析できるかをデモで披露した。
分析をして終わりではない。分かった分析結果からどのようなアクションを取るのか。それが非常に重要になる。その打ち手は2種類しかないと西内氏は語る。一つは売上というアウトカムにつながると思われる変えられる変数を変えてみることだ。もう一つの打ち手は変えられない説明変数(年齢や性別、地域など)に対して、狙いをずらしてみること。この場合は、このいずれの打ち手においても、大事なのは「とにかく早く試すことだ」と西内氏は強調する。
最後に西内氏はデータ活用において重要なことを次のようにまとめて講演を締めた。
「まず良いアウトカムと解析単位を考えること。次にデータとサイエンスが当たり前のチームを作ること。特に重要になるのが意思決定者。アウトカムと解析単位を考え、2種類の打ち手を駆使してアウトカムにつなげていく。そのための支援ソリューションを提供している。私たちの目的はみんなの手にデータサイエンスを提供すること。ぜひ、活用して欲しい」