全社共通のデータ分析基盤の構築で新たなビジネス知見を獲得
1つ目の事例として紹介されたのは、ネット型宅配クリーニングサービス「Lenet」と、ハウスクリーニング比較・依頼プラットフォーム「kirehapi」を手掛けるホワイトプラスのデータ基盤構築プロジェクト。本セッションに登壇した、ホワイトプラス 取締役CTO 森谷光雄氏は、同社がデータ分析基盤の構築を思い立った背景について次のように説明した。
「チームごとに独自にデータ活用は進めており、一定の成果は上げていたのですが、次第にチームごとにデータが独自の進化を遂げていった結果、チーム外の人間はもちろんのこと、チーム内のメンバーですらデータ活用の実態を容易に把握できなくなってしまいました。また別々のチームで同じような集計を重複して行ってしまう、チームごとにデータの定義がずれてくるなど、さまざまな弊害が顕在化してきました」(森谷氏)
そこでこれらの課題を解決すべく、同社は全社共通のデータ基盤の構築に乗り出すことになった。具体的には、社内に存在するさまざまなデータソースからデータを収集・統合し、Google BigQuery上で一括管理することにした。データの収集には、primeNumberが提供する分析基盤向けデータ統合自動化サービス「trocco(トロッコ)」を利用し、まずはGoogle BigQuery上のデータレイクにデータを集める。その後、これらのデータを基にDWHを構築し、さらにそこから特定の分析用のデータマートを生成する。
ユーザーはこのデータマートに対して、BIツールやスプレッドシートなどを通じてアクセスし、それぞれの目的に応じてデータの集計・分析を行う。データ収集・統合の処理にtroccoを採用した効果について、森谷氏は「もしtroccoがなければ自前のEmbulkクラスタを構築・運用しなければならず、かなりの工数が掛かっていたことでしょう。troccoを採用したことでそれが不要になり、本来注力すべきデータ活用の検討に工数を割けるようになりました」と高く評価する。
このようなデータ分析基盤を構築したことで、前述したデータ分析にまつわる諸課題を解決できたとともに、データの中から新たな知見も得られるようになったという。
「創業から今までの10年分のデータを分析したところ、『初回利用時の割引率』と『初回利用から2回目の利用への転換率』との間に相関があることを発見しました。この成果を生かして、初回利用時の割引率を最適化したところ、初回利用から2回目の利用への転換率が改善し、お客さまのライフタイムバリュー全体を最適化できました。今後もさらにデータ分析の取り組みを推し進め、その成果を経営・事業判断に反映させていきたいと考えています」(森谷氏)
開発・運用コストを抑えながらデータ分析基盤の構築を実現
次に紹介された事例が、タクシー配車アプリ「JapanTaxi」を開発・提供するJapanTaxiにおけるデータ分析基盤の構築プロジェクト。JapanTaxiは、専用のスマートフォンアプリを通じてタクシーの配車を依頼できるというサービスで、ユーザーがアプリから配車を“注文”すると、近隣を走る提携タクシー会社のタクシーに搭載されたタブレット端末に注文内容が通知される仕組みになっている。こうして「タクシーを使いたいユーザー」と「客を拾いたいタクシー」との間のマッチングを行う。
このほかにも同社では、タクシーに搭載したドライブレコーダーが記録した画像データを収集・解析し、付加価値のある知見や情報を抽出して顧客に提供するようなビジネスも展開している。こうしたビジネスモデルの根幹をなすのが、データ活用・分析の取り組みだ。JapanTaxi マーケティング部 BIグループ 伊田正寿氏は、同社のビジネスにおけるデータ分析基盤の役割について、次のように述べる。
「必要な時に必要なデータを適切な形で提供することで、意思決定をサポートするのがデータ分析基盤の役割です。また実際にデータ分析基盤を導入するに当たっては、開発・運用コストをなるべく減らして、いかに分析作業に集中できる環境を作れるかが重要だと考えています」(伊田氏)
しかし同社がかつて、JapanTaxiのデータ分析基盤の構築に乗り出した際には、分析基盤のデータ連携処理やデータ連携のワークフローの開発にかなりの工数が掛かることが判明し、頭を悩ませていたという。そこで、データ連携処理を自前で開発するのではなく、troccoを導入することで開発・運用コストを抑えることにした。
AWS(Amazon Web Services)およびMicrosoft Azureのクラウド環境上に構築したデータベースから、各種データをtroccoを用いて収集・統合し、GCPのGoogle BigQueryのデータレイク/DWH/データマートに反映させる。こうして構築されたDWHやデータマートのデータをBIツール「looker」を使って集計・分析し、その結果をSlack上に公開して関係者間で広く共有する。こうした一連のデータ分析・活用の仕組みを、troccoを採用したことで開発・運用コストを抑えつつ構築できたという。
「このデータ分析基盤を使うことで、新サービスのリリース直後からその効果を定量的に分析・評価し、結果をSlackによって広く共有できるようになりました。また、こうした取り組みを推し進めた結果、新サービスの問題点をリリース後すぐに把握して、サービス内容を素早く改善できるようになりました。今後も経営や事業の迅速かつ的確な意思決定をサポートすべく、データ分析基盤の活用をさらに進めていきたいと考えています」(伊田氏)
データ分析基盤におけるデータ統合の課題を解決する「trocco」
上記2つの事例で採用されたtroccoは、primeNumberが提供するSaaS型のクラウドサービスで、データ分析基盤において複数のデータソースからデータを収集してデータレイクやDWHに統合するための製品。
primeNumber 取締役執行役員 CPO 小林寛和氏は、troccoについて「『データソースの種類が多すぎる』『データ形式がばらばら』『データエンジニアが足りない』といった、データ統合にありがちな問題を解決し、企業のデータ活用を支援するためのサービス」と説明する。
その第一の特徴は、数多くのデータソースに対応している点にある。多種多様なデータベースやストレージサービス、DWHに対応するほか、代表的なCRMアプリケーションやマーケティングツールなどとも連携可能で、現時点では50種類以上のデータソースに対応している。
高い処理性能を備える点も大きな特徴で、国内で多くの実績を持つオープンソースのデータ転送フレームワーク「Embulk」をベースにしているため、その高い性能や可用性は実証済みだ。パフォーマンス要件が特に厳しいユーザー向けにはCPU/メモリを増強した「高速化オプション」も用意するほか、大容量のビッグデータにも対応する。
またGUIで簡単に操作できるため、高度なスキルを持つデータエンジニアでなくとも、あるいは非エンジニアであっても、十分使いこなせるようになっている。Slack通知機能など、サードパーティーアプリケーションとの連携機能も豊富に備えているので、普段使い慣れたツールからtroccoの動作を監視・制御することも可能だ。
「お客さまの中には、troccoのこうした特徴を生かして、データ分析基盤のデータ変換・統合作業を90%削減した例もあります。弊社ではサイトや資料を通じてtroccoのさらに詳しい情報を発信しているほか、データ分析に関する個別相談会も無料で実施していますので、データ分析基盤に関する課題をお持ちの方はぜひ気軽にご相談いただければと思います」(小林氏)
お問い合わせ
株式会社primeNumber