CodeZine(コードジン)

特集ページ一覧

データ分析で事業成長を加速させる鍵は「データ統合の効率化」――2社の事例から学ぶ分析基盤の作り方【デブサミ2020】

【14-A-5】事業グロースを加速させる「分析基盤」の作り方【JapanTaxi/ホワイトプラス事例】

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2020/03/30 12:00

目次

開発・運用コストを抑えながらデータ分析基盤の構築を実現

 次に紹介された事例が、タクシー配車アプリ「JapanTaxi」を開発・提供するJapanTaxiにおけるデータ分析基盤の構築プロジェクト。JapanTaxiは、専用のスマートフォンアプリを通じてタクシーの配車を依頼できるというサービスで、ユーザーがアプリから配車を“注文”すると、近隣を走る提携タクシー会社のタクシーに搭載されたタブレット端末に注文内容が通知される仕組みになっている。こうして「タクシーを使いたいユーザー」と「客を拾いたいタクシー」との間のマッチングを行う。

 このほかにも同社では、タクシーに搭載したドライブレコーダーが記録した画像データを収集・解析し、付加価値のある知見や情報を抽出して顧客に提供するようなビジネスも展開している。こうしたビジネスモデルの根幹をなすのが、データ活用・分析の取り組みだ。JapanTaxi マーケティング部 BIグループ 伊田正寿氏は、同社のビジネスにおけるデータ分析基盤の役割について、次のように述べる。

 「必要な時に必要なデータを適切な形で提供することで、意思決定をサポートするのがデータ分析基盤の役割です。また実際にデータ分析基盤を導入するに当たっては、開発・運用コストをなるべく減らして、いかに分析作業に集中できる環境を作れるかが重要だと考えています」(伊田氏)

JapanTaxi株式会社 マーケティング部BIグループ データエンジニア 伊田正寿氏
JapanTaxi株式会社 マーケティング部BIグループ データエンジニア 伊田正寿氏

 しかし同社がかつて、JapanTaxiのデータ分析基盤の構築に乗り出した際には、分析基盤のデータ連携処理やデータ連携のワークフローの開発にかなりの工数が掛かることが判明し、頭を悩ませていたという。そこで、データ連携処理を自前で開発するのではなく、troccoを導入することで開発・運用コストを抑えることにした。

システム構成図
システム構成図

 AWS(Amazon Web Services)およびMicrosoft Azureのクラウド環境上に構築したデータベースから、各種データをtroccoを用いて収集・統合し、GCPのGoogle BigQueryのデータレイク/DWH/データマートに反映させる。こうして構築されたDWHやデータマートのデータをBIツール「looker」を使って集計・分析し、その結果をSlack上に公開して関係者間で広く共有する。こうした一連のデータ分析・活用の仕組みを、troccoを採用したことで開発・運用コストを抑えつつ構築できたという。

 「このデータ分析基盤を使うことで、新サービスのリリース直後からその効果を定量的に分析・評価し、結果をSlackによって広く共有できるようになりました。また、こうした取り組みを推し進めた結果、新サービスの問題点をリリース後すぐに把握して、サービス内容を素早く改善できるようになりました。今後も経営や事業の迅速かつ的確な意思決定をサポートすべく、データ分析基盤の活用をさらに進めていきたいと考えています」(伊田氏)

データ分析基盤におけるデータ統合の課題を解決する「trocco」

 上記2つの事例で採用されたtroccoは、primeNumberが提供するSaaS型のクラウドサービスで、データ分析基盤において複数のデータソースからデータを収集してデータレイクやDWHに統合するための製品。

「troccoとは?」
troccoとは?

 primeNumber 取締役執行役員 CPO 小林寛和氏は、troccoについて「『データソースの種類が多すぎる』『データ形式がばらばら』『データエンジニアが足りない』といった、データ統合にありがちな問題を解決し、企業のデータ活用を支援するためのサービス」と説明する。

primeNumber 取締役執行役員 CPO 小林寛和氏
primeNumber 取締役執行役員 CPO 小林寛和氏

 その第一の特徴は、数多くのデータソースに対応している点にある。多種多様なデータベースやストレージサービス、DWHに対応するほか、代表的なCRMアプリケーションやマーケティングツールなどとも連携可能で、現時点では50種類以上のデータソースに対応している。

 高い処理性能を備える点も大きな特徴で、国内で多くの実績を持つオープンソースのデータ転送フレームワーク「Embulk」をベースにしているため、その高い性能や可用性は実証済みだ。パフォーマンス要件が特に厳しいユーザー向けにはCPU/メモリを増強した「高速化オプション」も用意するほか、大容量のビッグデータにも対応する。

 またGUIで簡単に操作できるため、高度なスキルを持つデータエンジニアでなくとも、あるいは非エンジニアであっても、十分使いこなせるようになっている。Slack通知機能など、サードパーティーアプリケーションとの連携機能も豊富に備えているので、普段使い慣れたツールからtroccoの動作を監視・制御することも可能だ。

 「お客さまの中には、troccoのこうした特徴を生かして、データ分析基盤のデータ変換・統合作業を90%削減した例もあります。弊社ではサイトや資料を通じてtroccoのさらに詳しい情報を発信しているほか、データ分析に関する個別相談会も無料で実施していますので、データ分析基盤に関する課題をお持ちの方はぜひ気軽にご相談いただければと思います」(小林氏)

お問い合わせ

 株式会社primeNumber



  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • CodeZine編集部(コードジンヘンシュウブ)

    CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

バックナンバー

連載:【デブサミ2020】セッションレポート

もっと読む

All contents copyright © 2005-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5