SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

開発現場インタビュー(AD)

LINEのデータドリブンな成長を支える「LINE Data Labs」とは? 機械学習・データ分析への取り組みと内製BI・レポーティングツール「OASIS」

  • X ポスト
  • このエントリーをはてなブックマークに追加

BI・レポーティングツール「OASIS」などの社内向けツールを開発するData Applicationチーム

 Data Applicationチームではデータ基盤のデータを活用しやすくするための社内ユーザー向けアプリケーションの開発を行っている。今年4月にリリースされた内製BI・レポーティングツール「OASIS」はその代表例。同ツールの開発、運用を担当しているのが吉田さんだ。吉田さんは新卒でSIerに入り、金融系システムに従事。その後Web系ベンチャーなどを経て2017年2月にLINEに入社。「前職でデータ基盤の構築に携わったことで、データと深く関わるようになり、興味を抱いた」と吉田さんはデータと付き合うようになったきっかけを語る。

 OASISは「Data Lake」と社内で呼ばれるHadoopクラスタのデータを、各社員がSparkアプリケーションを実行することで自由に抽出したり、分析したりできるツールだ。なぜこのようなツールを開発することになったのか。実はこれまで、各サービスから収集したデータを集計して、レポートを作成する業務をData Labsが全て担当していた。

 「このような体制だと、サービス担当者が自由にデータを分析したり、レポートを作成したりできません。しかもレポートが提供されるまで時間がかかるので、スピード感もありませんでした。このようなレポーティング業務の課題を解決するために作ったのがOASISです」(吉田さん)

Apache Zeppelinを参考にスピーディーにOASISを開発

 このようなレポーティング業務の課題解決に取りかかったのは昨年10月。当初はOSSのApache Zeppelinを使うことを考えていたという。しかし実際に運用してみたところ、「私たちが掲げていた安定稼働と厳密なデータアクセス制御という要件には合わないと判断した」という。そこで2018年1月より、Apache Zeppelinを参考に独自開発し、同年4月にリリースした。

 「Apache Zeppelinに修正パッチを送ることを何度か行っていたので、ソースコードも読み込んでいました。そういう実績があったので、特に開発で苦労したことはありません」と吉田さん。例えばPythonとScalaとRが同じSparkアプリケーションを共有するという特殊な仕組みやクエリの結果をグラフ化する仕組みなどはApache Zeppelinを参考にしたという。

 「レポートの作成をサービス側で完結できるようになったことが最大の効果です。例えばキャンペーンなどの効果測定のレポーティングも、サービス側でスピーディーに行えるようになっています」(吉田さん)

 本格稼働して1年経っていないのにもかかわらず、OASISはすでに多くの人に使われているという。全社でデータリテラシーを上げていこうという取り組みは行われてはいるとはいえ、これだけ早く普及したのには理由があるという。

 「使い勝手の良さもありますが、何より吉田さんのサポートの手厚さですね。SlackにOASISのサポートチャンネルがあるのですが、『こういう機能が欲しい』と問い合わせると、5分後には実装されていたという話も聞こえてくるくらい。質問を投げるとすぐ返ってくるんです。サービス側だけで試行錯誤ができるOASISのような環境は、会社のデータ活用レベルを上げるためにとても重要だと思います」(牟田さん)

 菊地さんは、「OASISは社内のデータリテラシーを上げたり、分析担当者間で情報を共有したりする上でとても有効だと思います。サービスの企画運営に関わる人が日々目にするためのダッシュボードなど、グラフを綺麗に並べて見せることもできるし、実際どういう集計処理を行っているかについても、すぐに抽出ロジックが確認できます。必要なデータが何で、どう加工するとどんなデータが得られるか、表形式でもグラフ形式でも表示できるようになっているし、ちょっと見たいものが違っても、直接コードを修正すれば良いので、とても使い勝手が良いです」と絶賛する。

次のページ
これだけの規模のデータを扱えるところはそうそうない、エキサイティングな環境

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
開発現場インタビュー連載記事一覧

もっと読む

この記事の著者

中村 仁美(ナカムラ ヒトミ)

 大阪府出身。教育大学卒。大学時代は臨床心理学を専攻。大手化学メーカー、日経BP社、ITに特化したコンテンツサービス&プロモーション会社を経て、2002年、フリーランス編集&ライターとして独立。現在はIT、キャリアというテーマを中心に活動中。IT記者会所属。趣味は読書、ドライブ、城探訪(日本の城)。...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/11272 2018/12/19 11:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング