CodeZine(コードジン)

特集ページ一覧

『データサイエンスの無駄遣い』著者が解き明かすデータ分析の面白さ――「人間にとってのわかりやすさを超越する」ということ

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/11/22 11:00

 「データサイエンス」と聞くと、難しそうな印象を持つ人は多いだろう。そんな人に読んでいただきたいのが、この1冊、博報堂DYメディアパートナーズの篠田裕之さん著『データサイエンスの無駄遣い 日常の些細な出来事を真面目に分析する』である。現役のデータサイエンティストが分析するのは、「飲み会での孤立」「LINEの既読スルー」など、日常生活において起きそうな事象ばかり。読み終えた頃にはデータサイエンスがぐっと身近に感じられるに違いない。果たしてエンジニアに「データ分析」という視点が加わったらどうなるのか。期待を寄せつつ、本を書いた目的やデータサイエンスの醍醐味を篠田さんに伺った。

目次

ごく自然にデータ分析をコンテンツ開発に融合させ、相乗効果を出せる仕事へシフト

――篠田さんはデータサイエンティストとしてどんなお仕事をされていますか。また、どういった経緯で現在のお仕事に就かれたのですか?

 現在は広告会社のデータサイエンティストとして、テレビの視聴ログやWeb閲覧ログなどさまざまなデータを用いた分析を行い、その結果に基づいたテレビ番組やメディアコンテンツの開発を行っています。入社した2008年当時は「データサイエンティスト」という職種も言葉も現在ほど注目されておらず、はじめからデータサイエンティストを志したわけではありません。

 メディアに関する仕事を希望し、入社後はメディアプランナーとしてWeb広告の運用などを行ううちに、アドテクノロジーの進化に伴って、データ分析に携わるようになりました。

 もともと大学院では、コンピュータサイエンスを専攻していたためプログラミングの知識があり、Flashなどプログラムを用いたインタラクティブなコンテンツ開発が好きでした。なので、仕事のキャリアはメディアプランニングから始まりましたが、ごく自然にデータ分析をコンテンツ開発に融合させて相乗効果を出せる仕事へとシフトしていきました。

博報堂DYメディアパートナーズ 篠田裕之氏氏
博報堂DYメディアパートナーズ 篠田裕之氏

――では、プログラミングの素養はあったとはいえ、データ分析については仕事で学びながら体得されたんですね。

 そうです。大学院ではアプリケーション開発寄りの研究をしていたので、統計や機械学習などに本格的に触れたのは、仕事でデータ分析に関わるようになってからですね。

――それが今や『Pythonで動かして学ぶ!Kaggleデータ分析入門』を執筆されるようになられたわけですね。そんな篠田さんが『データサイエンスの無駄遣い 日常の些細な出来事を真面目に分析する』という、なかなか衝撃的なタイトルの本を出されたのは、どのような経緯からなのでしょうか。

 私にとっては2冊目の本で、こちらのほうが「私らしい」と思っています。もともと好きが高じて、データビジュアライズやインタラクティブなサイト制作などを趣味で作ってはコンテストに応募したり、日常的なテーマをデータ分析しブログに執筆したりしていました。それが徐々に仕事でも依頼されてメディアに執筆するようになり、Yahoo!ニュースのトピックスに掲載されてバズったり、アプリ開発コンペの賞をいただいたりしました。そのような中で自分が発信してきたことを、どこかでまとめたいと思うようになりました。

 そんな時に、翔泳社の書籍編集部の方からご連絡をいただきまして、その時は「Kaggleの本」というリクエストで、1冊目の『Pythonで動かして学ぶ!Kaggleデータ分析入門』に結実するんですが、自分としては「飲み会で孤立しないためのセル・オートマトン」といった少しゆるめでユーモアのあるアプローチのほうが、自分らしさが出て手応えもある……ということでその場で逆提案してみました。

エンジニアでも、非エンジニアでも”読み物”としてデータサイエンスを楽しめる1冊

――『データサイエンスの無駄遣い 日常の些細な出来事を真面目に分析する』は、篠田さんからの企画だったんですね。

 はい。私が趣味でやっている個人サイトでは、ゆるいテーマを真面目にデータ分析した内容を紹介しているのですが、SNSなどでの反応からそれなりに手応えがあったので、面白い本になりそうだという期待がありました。本書のような活動は仕事にも活かされています。例えば私の仕事において広告効果の予測精度を上げることはもちろん重要ですが、ある程度まで精度が上がるとそれ以上の改善はアクションが変わらないというケースがあります。

 そのような場合には、予測精度をさらに改善するのではなく、「データの解釈」に基づいて広告を出す場としてのコンテンツ自体を一から考えることが重要になるんじゃないかと。要はデータを使って何か面白いものをつくることが、私が博報堂DYメディアパートナーズでデータサイエンティストをやる意義であり、醍醐味なのではないかと思います。

 本書では「データやテクノロジーを活用して、日常の些細な疑問に立ち向かうこと」をテーマに、9つのストーリーを取り上げており、どなたにも何か共感してもらえる点があるのではないかと思っています。テック系やユーモア系の読み物が好きな方には特に楽しんでもらえると思いますが、データ分析に詳しくない人、例えば私の両親が読んでも面白いと感じるものを書きました。

―― 誰が読んでも興味深い内容ですし、くすっと笑えそうですね。データサイエンスやアプリ開発など、「ちょっとわかる」人が読むとまた異なる興味が湧いてきそうです。

 読み物パートと技術解説パートがあり、データ分析やテクノロジーに興味のある方に読んでいただいても、テクニカルな誤りやコードの不備がないように書きました。各種ソフトウェアの詳細な手順まで細かく執筆しているので、各種ソフトウェア・ツールを始めるための参考にもしていただけるのではないでしょうか。ただ、読み物パートに関しては実にゆるい内容なので、リラックスして読んでいただければと思います。

 各章はあくまで個人的な経験に基づく内容でありながら、幅広いことに応用できるエッセンスは入れました。例えば、第1章の「LINEの既読スルーにランダムフォレスト(※)で立ち向かう」では、どんなLINEメッセージを送ると、既読スルーされやすいのかを分析しています。マーケティングメールやSNS、広告など顧客とのコミュニケーションにおいて汎用性があるのではないかと思います。

 他にも、「休日に会社の同僚と遭遇しないための動き方を物理シミュレーションで解き明かす」などは、もしかしたら観光地での導線設計などに応用できるかもしれません。内容がトリッキーではあるので、そのまま使えるわけではありませんが、「こんなふうに分析やシミュレーションをするんだ」という読後感は得られると思います。むしろそれで興味を持っていただいて、読者の方が本書とは別のテーマを持って実践いただくという、そんな役立ち方ができればいいなと思います。

(※)ランダムフォレスト

 「決定木」と呼ばれる予測モデルを複数組み合わせたアンサンブルモデル。教師付き機械学習のアルゴリズムの一種。


  • LINEで送る
  • このエントリーをはてなブックマークに追加

バックナンバー

連載:キーパーソンインタビュー

もっと読む

著者プロフィール

  • 伊藤 真美(イトウ マミ)

    エディター&ライター。児童書、雑誌や書籍、企業出版物、PRやプロモーションツールの制作などを経て独立。ライティング、コンテンツディレクションの他、広報PR・マーケティングのプランニングも行なう。

  • 鍋島 英莉(編集部)(ナベシマ エリ)

    2019年8月に翔泳社へ入社し、CodeZine編集部に配属。同志社大学文学部文化史学科卒。

あなたにオススメ

All contents copyright © 2005-2021 Shoeisha Co., Ltd. All rights reserved. ver.1.5