BI・レポーティングツール「OASIS」などの社内向けツールを開発するData Applicationチーム
Data Applicationチームではデータ基盤のデータを活用しやすくするための社内ユーザー向けアプリケーションの開発を行っている。今年4月にリリースされた内製BI・レポーティングツール「OASIS」はその代表例。同ツールの開発、運用を担当しているのが吉田さんだ。吉田さんは新卒でSIerに入り、金融系システムに従事。その後Web系ベンチャーなどを経て2017年2月にLINEに入社。「前職でデータ基盤の構築に携わったことで、データと深く関わるようになり、興味を抱いた」と吉田さんはデータと付き合うようになったきっかけを語る。
OASISは「Data Lake」と社内で呼ばれるHadoopクラスタのデータを、各社員がSparkアプリケーションを実行することで自由に抽出したり、分析したりできるツールだ。なぜこのようなツールを開発することになったのか。実はこれまで、各サービスから収集したデータを集計して、レポートを作成する業務をData Labsが全て担当していた。
「このような体制だと、サービス担当者が自由にデータを分析したり、レポートを作成したりできません。しかもレポートが提供されるまで時間がかかるので、スピード感もありませんでした。このようなレポーティング業務の課題を解決するために作ったのがOASISです」(吉田さん)
Apache Zeppelinを参考にスピーディーにOASISを開発
このようなレポーティング業務の課題解決に取りかかったのは昨年10月。当初はOSSのApache Zeppelinを使うことを考えていたという。しかし実際に運用してみたところ、「私たちが掲げていた安定稼働と厳密なデータアクセス制御という要件には合わないと判断した」という。そこで2018年1月より、Apache Zeppelinを参考に独自開発し、同年4月にリリースした。
「Apache Zeppelinに修正パッチを送ることを何度か行っていたので、ソースコードも読み込んでいました。そういう実績があったので、特に開発で苦労したことはありません」と吉田さん。例えばPythonとScalaとRが同じSparkアプリケーションを共有するという特殊な仕組みやクエリの結果をグラフ化する仕組みなどはApache Zeppelinを参考にしたという。
「レポートの作成をサービス側で完結できるようになったことが最大の効果です。例えばキャンペーンなどの効果測定のレポーティングも、サービス側でスピーディーに行えるようになっています」(吉田さん)
本格稼働して1年経っていないのにもかかわらず、OASISはすでに多くの人に使われているという。全社でデータリテラシーを上げていこうという取り組みは行われてはいるとはいえ、これだけ早く普及したのには理由があるという。
「使い勝手の良さもありますが、何より吉田さんのサポートの手厚さですね。SlackにOASISのサポートチャンネルがあるのですが、『こういう機能が欲しい』と問い合わせると、5分後には実装されていたという話も聞こえてくるくらい。質問を投げるとすぐ返ってくるんです。サービス側だけで試行錯誤ができるOASISのような環境は、会社のデータ活用レベルを上げるためにとても重要だと思います」(牟田さん)
菊地さんは、「OASISは社内のデータリテラシーを上げたり、分析担当者間で情報を共有したりする上でとても有効だと思います。サービスの企画運営に関わる人が日々目にするためのダッシュボードなど、グラフを綺麗に並べて見せることもできるし、実際どういう集計処理を行っているかについても、すぐに抽出ロジックが確認できます。必要なデータが何で、どう加工するとどんなデータが得られるか、表形式でもグラフ形式でも表示できるようになっているし、ちょっと見たいものが違っても、直接コードを修正すれば良いので、とても使い勝手が良いです」と絶賛する。