Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

LINEのデータドリブンな成長を支える「LINE Data Labs」とは? 機械学習・データ分析への取り組みと内製BI・レポーティングツール「OASIS」

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2018/12/19 11:00

 国内で屈指の大規模データを有するLINE。それをビジネスに活かすため、同社にはLINEアプリや、LINE NEWSなどのLINEのファミリー(関連)サービスのデータを事業へ活用するための専門的な開発組織「LINE Data Labs」が設置されている。同組織はどんな規模で、どういう業務が行われているのか。またLINEでデータを扱う楽しさや面白さはどこにあるのか。内製BI・レポーティングツール「OASIS」の開発経緯などを含めて、LINE Data Labsでの取り組みを明らかにしていく。

目次

 「OASIS」の詳細については、インタビューに登場する吉田さんが執筆したブログも併せてご覧いただきたい。

データ分析・活用に関わる専門開発組織「LINE Data Labs」

 LINEに各種ファミリーサービスのデータを事業へ活用するための専門的な開発組織「LINE Data Labs」が新設されたのは2016年3月。現在、兼務を除き約50人の機械学習エンジニア、データサイエンティスト、データエンジニア、データプランナーなどが在籍する。LINE Data Labsは「Machine Learningチーム」「Data Analysisチーム」「Data Applicationチーム」「Data Platformチーム」「Data Planningチーム」の5つのチームで構成されている。

 では具体的に各チームではどんなことをやっているのか。教えてくれたのはMachine Learningチームの菊地悠さん、Data Analysisチームの牟田博和さん、Data Applicationチームの吉田啓二さんの3人だ。

左から、LINE Data Labs Machine Learningチーム 菊地悠さん、同 Data Analysisチーム 牟田博和さん、同 Data Applicationチーム 吉田啓二さん
左から、LINE Data Labs Machine Learningチーム 菊地悠さん、同 Data Analysisチーム 牟田博和さん、
同 Data Applicationチーム 吉田啓二さん

レコメンドエンジンを開発するMachine Learningチーム

 「Machine Learningチームの所属メンバーは10人。ロールは大きく3つあり、機械学習のエンジニアとその周辺のサーバサイドやインフラに携わるエンジニア、そしてプランナーと呼ばれるプランニングやプロジェクトマネジメントに従事する人たちで構成されています。その中で私は、LINEスタンプやLINEマンガ、LINE NEWSなどのサービスで使われるレコメンドエンジン開発などのプロジェクトマネジメントに従事しています」

 菊地さんは昨年10月にLINEに入社した。前職は通信キャリアの研究所であり、機械学習に触れたのは「ここ数年」。それまではUIやUX、セキュリティなどに携わっていたという。現在はMachine Learningチームでプロジェクトマネジメントに従事している。

 「データの規模が大きいレコメンドの例だと、LINEスタンプになります。販売されているスタンプ数は約300万セット、月間のアクティブユーザー数は主要4か国だけでも約1億6500万人います。つまりLINEスタンプのレコメンドエンジンであれば、数億人に対して数百万あるアイテムのレコメンドをするためのデータを扱うことになる。実行しているジョブの量でいうと、機械学習のモデル更新は毎日数百回、予測・推定処理は1000を超える回数を実行しています。データが大きくなると、当然ながら1台のサーバには載らないですし、分散して処理をするにしてもデータの同期を極力減らす、といった必要が出てくる場合もあります。機械学習でよく使われるscikit-learnなどのライブラリなどにはあまり頼らず、数学に強い機械学習エンジニアが数式から解いて、スクラッチに近いところからレコメンドエンジンを作ったりしています」(菊地さん)

 機械学習のエンジニアのおよそ半数がアカデミア出身。博士号を取得している人もいるという。

 レコメンドエンジンの中にはディープラーニングを使っているものもある。「ユーザー自体をレコメンドするエンジン『Look a like』はその一つ。例えば過去のキャンペーンや広告に反応したユーザー(シードユーザー)とよく似た、まだリーチできていないユーザーを抽出するなどに使われるエンジンです。シードユーザーごとに別々に学習を走らせ、予測モデルを作る必要があること、また元データの性質なども考慮し、比較的シンプルなStacked Auto-Encoderという技術を使っています」(菊地さん)

 レコメンドエンジンの提供のパターンは2つある。「事業部側から依頼をもらうケースもあれば、すでにレコメンドエンジンを提供している場合は、新しいモノに変えさせてほしいと提案するケースもある」と菊地さん。後者のケースでは、次に紹介するData Analysisチームと連携して動くこともあるという。「その場合は新しいものを数パターン用意して既存のものと、ABテストで比較検証を行います」(菊地さん)

意思決定に役立つデータ分析を担当するData Analysisチーム

 Data Analysisチームはデータサイエンティストとエンジニアで構成されており、データサイエンティストは事業部の意思決定を支援するためのデータ分析、エンジニアはRなどを使って、データ処理を効率化するツールやA/Bテストの検証を自動化する仕組みなど、データサイエンティストが分析する効率を上げるための環境の開発・整備を行っている。最近ではLINE全社でデータ活用を推進していこうという動きがあり、「そういった活動を盛り上げることも私たちのチームの役割」と、同チームのマネジャーを務める牟田さんは説明する。

 牟田さんは半導体エンジニアとして勤務したあと、データを活用した経営コンサルティングの経験を経て、2015年11月にLINEに転職。現在は、複数のデータサイエンス関連のプロジェクトマネジメントに従事している。

 「私たちのチームでは、広告やLINEスタンプなどのサービスまたはプロジェクトに専任という形で関わっているメンバーが多く、それぞれの状況に応じてさまざまな支援をしています。例えば私が関わっているLINEマンガでは、継続に強く影響するユーザーの行動を分析によって明らかにしたり、それを活かしたUIの仕様検討のための分析をしたり、その効果検証のためにA/Bテストを実施したり、また大型キャンペーンの効果検証をしたりしています」(牟田さん)


  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 中村 仁美(ナカムラ ヒトミ)

     大阪府出身。教育大学卒。大学時代は臨床心理学を専攻。大手化学メーカー、日経BP社、ITに特化したコンテンツサービス&プロモーション会社を経て、2002年、フリーランス編集&ライターとして独立。現在はIT、キャリアというテーマを中心に活動中。IT記者会所属。趣味は読書、ドライブ、城探訪(日本の城)。...

バックナンバー

連載:開発現場インタビュー
All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5