ヤフーのデータソリューションサービスとは
ヤフーのデータソリューションとは、主に法人・自治体に向けて、ヤフーの保有するビッグデータを統計化し、組織内でデータ分析が推進されるようダッシュボードやAPIといった形で提供したりするサービスである。
例えば、ヤフーの検索ビッグデータや位置情報データを分析できるデスクリサーチツール「DS.INSIGHT」、2022年1月にリリースしたばかりの「DS.INSIGHT Persona」、ヤフーの統計化された検索ビッグデータを自社分析環境に直接連携できる「DS.API」だ。
「DS.INSIGHT Persona」は、ヤフーのビッグデータからターゲットの属性情報や興味関心を把握することで、より詳細なペルソナ作成を支援するアプリケーション。実際のアウトプット例も紹介された。
また、ヤフーのデザイナーメンバーは「DS.API」を使ってデータビジュアライゼーションを学び、その情報をプロダクトデザインにも活かしているという。
データデザインは「感覚記憶」に訴えることが重要
そもそもデータビジュアライゼーションとは何か。駒宮氏は「分かりづらいデータを分かりやすいに変えるもの」だと表現する。文字と数字で表されるデータをグラフや図で表現すること。いわば「データの可視化」である。
同じデータを使ってプレゼンを行うにしても、棒グラフや折れ線グラフなどのデータビジュアライゼーションの善し悪しで、その伝わりやすさは大きく左右される。見ている側もグラフの表現によって、瞬時に数字の意味を理解し、プレゼンターの話を集中して聞くことができる。
「データの可視化をすることで、相手が認知・理解していなかった情報や事実を伝達し、相手の判断や行動を促す。または、変えることができる重要な業務だと考えています」(駒宮氏)
人の記憶には「感覚記憶」「短期記憶」「長期記憶」の3つがある。データビジュアライゼーションでは、色・形・位置などの視覚で反応する感覚記憶に訴えかけることが、特に重要となる。
駒宮氏は感覚記憶の例として、「9の数字を見つけてください」の見せ方を2つ提示。9に赤い色がついた方が瞬時に見つけやすいことを示し、感覚記憶の重要性を強調した。
データビジュアライゼーションの種類
データビジュアライゼーションは、大きく2つに分類できる。目的が組織や相手の課題解決である「インフォメーションデザイン」と、自分の主張伝達である「データアート」だ。
プレゼンなどでは、インフォメーションデザインが使われることが多く、まだ事実と確かめられていない仮説を扱う「仮説検証型」「仮説探索型」、事実を扱う「事実報告型」「事実説明型」に分けられる。本セッションでは、インフォメーションデザインについて説明が行われた。
仮説検証型
「〇〇は△△であるだろう(あるのではないか?)」という仮説をデータを使って検証。事実かどうかを裏付けるための視覚化である。事前にデータによって裏付けたい仮説が視覚化の基点となっている。
仮説探索型
データ視覚化のはじまりの時点には特に仮説はなく、データ視覚化の行為そのものを通じて仮説を立案していく。
事実報告型
事業運営上、定点的に確認・モニタリングすべき指標値を、定型フォーマットで報告するためのデータ視覚化。
事実説明型
仮説検証型や仮説探究型のデータ視覚化の結果として確認された事実や発見を、読み手の理解しやすいように説明するためのデータ視覚化。
駒宮氏は、これらを「伝えたい目的に合わせた手法を選ぶことが重要」だと語り、以下のようにまとめた。
- 仮説検証型:事実かどうかを確かめるための視覚化
- 仮説探索型:仮説を立案するためのデータ視覚化
- 事実報告型:報告するためのデータ視覚化
- 事実説明型:読み手が理解しやすいように説明するためのデータ視覚化
伝えたい目的に合わせたグラフの選び方
続いては、目的に合わせたグラフの選び方のポイントについて、代表的なグラフ例を示しながら解説が行われた。
へだたりを見せる
固定の基準点からの変化を強調する。基準点を0として、どう減っているのか増えているのかを分かりやすく見せることが重要。男女比などを見せる際には、対称棒グラフがおすすめとのこと。
相関関係を表す
散布図やバブルチャートなどがよく使われる。ポイントは、位置関係が分かりやすい2次元グラフでまとめること。3次元になると位置関係が分かりにくくなってしまうからだ。
ランキング
順位や位置がデータの数値より重要な場合に使われる。視点誘導に合わせたグラフ選びがポイント。例えば、画面上でグラフを見せる際は、上から下へ視点が動くため、縦の視点誘導となる横の棒グラフがおすすめ。紙媒体の場合は縦長のグラフの方が良い場合もある。
分布をみる
全体の中でどのぐらい分布があるのかを見せるために使われる。以下のスライド内容の他に、線状の散布図(ドット・ストリップ・プロット)、バーコード・プロット、ドット・プロット、累積曲線、度数折れ線図などのグラフもある。
時系列変化を表す
時系列変化を表すグラフは折れ線グラフが使いやすい。時期の連続性の見せ方や伝えたい部分の色を変えるなど、目的に合わせて工夫することでより伝わりやすくなる。
量を比較する
基本的に棒グラフが使われるが、細かい数値が不要な際は、マリメッコを使うことも多い。リッチな表現をしたい場合は、アイソタイプを使うこともある。
割合や構成要素を見る
全体を見ていくことが多いため、ツリーマップが使いやすい。使い道は限られるが、ボロノイ図は全体感を得ることができる特徴的なグラフが使われることもある。
地図を使った表現
所在地や、地理的な傾向が重要な場合に使われる。
流れ図
ユーザー行動の移動などを表す際に使われる。
目的に適したグラフを選ぶ
このようにデータを表すグラフはたくさんの種類がある。だが、適切でないグラフを選んでしまったり、誇張表現をしてしまったりなど、読み解きにくい情報を提示してしまうこともあると、駒宮氏は警鐘を鳴らす。例えば、3Dにすることで伸び率が分かりにくくなってしまうグラフ表現だ。
「より分かりやすく情報を識別できるように、伝えたい情報を正確に表現できるグラフを選ぶ視点が大切です」
年度比較や推移を伝えたい場合、円グラフを2つ並べるだけでは伝わりにくい。その場合は、棒グラフを使い、視線移動で比較しやすいグラフをデザインすることが適切だと、駒宮氏は語る。
グラフの情報量をデザインする
データビジュアライゼーションでは、グラフの情報量をデザインする必要性がある。情報量が多すぎて、何からみていけばいいか分からないといったことがあるからだ。
「人間が一度に処理できる情報量には限界があるため、情報伝達の効率性が重要です。そのためには相手に伝わりやすいデザインにすることが必要になります」
そこで大事な概念が「シグナル」と「ノイズ」である。データが持つ元来の意味が、より相手にとって伝わりやすくなる効果を「シグナル」。データが持つ元来の意味でないものが相手に伝わってしまう効果を「ノイズ」という。シグナルを最大化し、ノイズを最小化することが重要となってくる。
シグナルとノイズについてより理解するために、データビジュアライゼーションの権威的存在であるエドワード・タフテ氏が提唱する「データインクレシオ」という概念が紹介された。例えば、以下のスライドで説明すると、「データインク」とはデータそのものを表す部分(棒グラフの棒の部分)、「ノン・データインク」とはデータ以外のグラフの枠線や軸の補助線を表す。
「データインクレシオ」とはデータインクとノンデータインクの比率のことである。余計な装飾を削ぎ落としてシンプルにすればノイズが減り、シグナルが高まる。データビジュアライゼーションとして良いデザインとなる基本的な考えである。
余計な装飾が行われ、データインクレシオが低くなってしまったグラフが以下である。逆に良い例は、余計な装飾が削ぎ落とされ、シンプルなデザインにすることで、データインクレシオが高くなっている。
セッションではデータビジュアライゼーションにおいて重要な視覚属性とアイコン、属性の強さなどが以下のように紹介されたので、ぜひ参考にしてほしい。
最後に駒宮氏は、「データ活用のスキルは、今やエンジニア・サイエンティストだけの領域ではない。ビジネス職種の営業提案や企画担当者、デザイナー・クリエイティブ担当などもデータを理解し、活用していくことが求められていくだろう」と語り、一緒に、データ×クリエイティブを盛り上げていこうと訴え、セッションをまとめた。