SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2023 KANSAI セッションレポート(AD)

ヤフーに学ぶ! データ活用の流れやデータ可視化の開発コストを下げるコツとは?

【Session3】ヤフーで取り組むデータ可視化の流れ(FaaSで小さく始めるデータ準備から、Nuxtでのツール開発まで)

  • X ポスト
  • このエントリーをはてなブックマークに追加

 日本最大級のポータルサイト「Yahoo! JAPAN」を運営し、広告事業やeコマース事業、会員サービス事業などを展開しているヤフー。それらのサービスで蓄積したビッグデータを社内外のアナリストがサービス横断で分析できるよう「ヤフー・データソリューション」を提供している。その中には「DS.INSIGHT」と「DS.GALLERY」というデータ可視化サービスがある。この2つのサービスの開発に携わったヤフー 大阪オフィス所属 データソリューション事業の猪目美紗氏が同サービスの概要とデータ活用の流れ、データ可視化の開発運用コストを下げるコツなどについて解説した。

  • X ポスト
  • このエントリーをはてなブックマークに追加

記事の情報は登壇当時のものになります。

データを可視化するDS.INSIGHT・DS.GALLERY、具体的な使い方

 ヤフーが展開するヤフー・データソリューションとは、ヤフーのさまざまなサービスで取得・蓄積したビッグデータを分析できるサービスである。その中には可視化までしてくれるサービスがある。それが「DS.INSIGHT」と「DS.GALLERY」である。

 「DS.INSIGHT」はヤフーのビッグデータを分析できるデスクリサーチツールで、「企業や教育機関に提供している」と猪目氏は説明する。一方の「DS.GALLERY」は、会員登録が不要で、データ可視化コンテンツを一般向けに提供しているサービスである。

ヤフー株式会社 データソリューション事業 エンジニア 猪目美紗氏
ヤフー株式会社 データソリューション事業 エンジニア 猪目美紗氏

 具体的にどんなデータが可視化されるのか。ここで猪目氏はまず、DS.INSIGHTのデモを実施。基本画面で検索窓にキーワードを入力すると、そのワードと一緒に検索されたキーワード(共起キーワード)がマップ形式で表示されるのだ。それらのキーワードについて性別や地域別割合という切り口でも見ることができる。

 地域別の面白い事例として、「豚まん」と「肉まん」と言うキーワードを使って分析の例を紹介。肉まんは関東、豚まんは関西でより多く検索されていることがはっきりと日本地図に示された。そのほかにも検索数の推移グラフなども用意されており、例えば先の「肉まん」や「豚まん」は、「冬になると上昇するワード」と猪目氏は話す。

 DS.GALLERYでは、最近急上昇しているトレンドワードをチェックできる。それらのトレンドワードの性別や年代別の割合も表示。カテゴリーごとのランキングも見ることができる。「毎週更新。カテゴリー30種の中で3つのカテゴリーをピックアップしています」と猪目氏。すべてのカテゴリーを見たい場合は、DS.INSIGHTへの登録が必要だ。

 このようなデータ活用の仕組みをヤフーではどう作ったのか。データはユーザーのアクションから生まれる。ページの閲覧やリンククリック、検索、購入などのユーザーのアクションがログとして記録され、ロギングAPIによってデータレイクに送られる。データレイクとは「ヤフーの多種多様かつ膨大なデータをまとめて保管しておくストレージ。ヤフーではApache Hadoopを使用している」と猪目氏は説明する。

 アナリストはデータレイクのデータを活用することもできるが、ヤフーではデータをより活用しやすく整理した、データハウスやデータマートも用意。データソリューションでは分析用にTeradata、可視化ツール用にオブジェクトストレージ、Apache Cassandraなどを使用している。

 可視化ツールとは、データを理解しやすいようにグラフ化やダッシュボード化をするためのツール。ヤフーが提供しているのが、DS.INSIGHTやDS.GALLERYである。アナリストはこれらの可視化ツールを使って分析をすることになるが、ヤフーでは可視化ツールを社内外のアナリストに提供している。またアナリストがデータベースから直接データを取得して分析する場合は、「Tableauがよく使われている」と猪目氏は語る。

DS.INSIGHTとDS.GALLERYの画面
DS.INSIGHTとDS.GALLERYの画面

次のページ
3パターンある可視化ツールに至るデータの流れ

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers Summit 2023 KANSAI セッションレポート連載記事一覧

もっと読む

この記事の著者

中村 仁美(ナカムラ ヒトミ)

 大阪府出身。教育大学卒。大学時代は臨床心理学を専攻。大手化学メーカー、日経BP社、ITに特化したコンテンツサービス&プロモーション会社を経て、2002年、フリーランス編集&ライターとして独立。現在はIT、キャリアというテーマを中心に活動中。IT記者会所属。趣味は読書、ドライブ、城探訪(日本の城)。...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

丸毛 透(マルモ トオル)

インタビュー(人物)、ポートレート、商品撮影、料理写真をWeb雑誌中心に活動。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:LINEヤフー株式会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/18383 2023/10/11 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング