データ可視化の開発運用コストを下げるためのポイント
「次にデータ可視化の開発運用コストを下げるために、私が普段気をつけていることを話したい」と前置きし、猪目氏は開発運用コストを下げるためのポイントの解説へと移った。
1つ目は、データ更新頻度の検討である。データ更新頻度が低ければ開発コストは小さくなり、高くなると、開発運用コストは大きくなる。例えばデータ更新が不要で、その場限りのスナップショットでOKな場合は、1回データをダウンロードして、その場限りの可視化だけで済む。だが週1回など定期的な更新、さらにリアルタイムな更新が必要になるなど、更新頻度が上がれば上がるほど、集計ミスの確率も上がる。その分、システム障害が発生する確率も上がる。「要件を満たす限りでデータ更新頻度を下げることを勧めます」と猪目氏は指摘する。
また更新頻度だけではなく、更新タイミングにも気をつけたい。データ更新のタイミングは、データ集計の失敗が起こるタイミングでもあるからだ。「データ更新のタイミングは、できるだけユーザーに影響がない、かつ運用担当者が万一失敗してもすぐに対応できるタイミングを選ぶのが良いと思います」(猪目氏)
2つ目は、使うデータ量の検討。使うデータ量が少なければ少ないほど、開発運用コストは小さくなり、多ければ多いほど開発運用コストは大きくなる。「DS.GALLERYのように、例えば少量のデータで簡易的な可視化であれば、決まったデータを読み込む静的Webサイトで十分かもしれません」(猪目氏)
一方、DS.INSIGHTのように大量のデータから複雑な絞り込みや検索にも対応しなければならないような構成にするのであれば、裏でAPIリクエストを行う動的Webアプリケーションを開発することになる。「私は両方の開発に携わったことがあるが、作業はすごく大変になる。これもできるだけ要件を満たせる範囲で、可能なら静的Webサイトでいけるか考えてみてはどうか」と猪目氏は話す。
データ量が少なければ可視化ツールにExcelを使うこともできる。一方、データ量が多くなると、TableauのようなBIツールが必要になり、利用料もかかる。またBIツールを活用すると、使える人も限られてくる。「できるだけ活用するデータ量も減らすことを考えるコトも必要だと思います」(猪目氏)
3つ目は、データの見せ方。一般的なグラフで良ければ開発運用コストは小さくてすむが、ダッシュボード化するなど少しリッチに見せたい、今までにない可視化表現を創造したいと、より特殊な見せ方が求められるようになると開発運用コストも大きくなっていくからだ。「できるだけ一般的なグラフで表現することを検討することをお勧めします」(猪目氏)
もう一つ、見せ方で大事になるのはユーザーに合わせた可視化表現をすること。DS.GALLERYは一般向けなので、楽しさ重視の見せ方となっており、DS.INSIGHTはデータ活用したい人向けなので、機能重視の見せ方となっている。
またデータ可視化をする際に、忘れがちだが気をつけたいポイントがある。
まずは、データの調達について。データの収集・加工から行うのは大変なので、「すぐに使えるデータやAPIがないか、社内外で探してみましょう」と猪目氏。次に、データ取得APIの利用料についても気をつけたい。従量課金制APIをライブ接続すると、利用料が高額になるからだ。「定期実行で節約することをお勧めします」(猪目氏)
さらにDS.INSIGHTやDS.GALLERYのように社外公開する場合は、社外秘データが含まれていないかはもちろん、差別用語、アダルトワードなど公開NGワードが含まれていないかをチェックすることも重要になると猪目氏は言う。
「データ可視化の実現方法は多種多様です。企画の段階から要件を絞り込んで、できるだけ小さく初めて見ることが大事だと思います」(猪目氏)
![ユーザーに合わせた可視化表現の例](http://cz-cdn.shoeisha.jp/static/images/article/18383/18383_003.png)