対象読者
- SQLの基本は理解しているがより実践的な分析に取り組みたい方
- 分析結果を可視化したい方
サンプルの動作確認環境
- macOS High Sierra 10.13
- Docker 17.06
- Re:dash 2.0
- PostgreSQL 9.6
「Re:dash」とは
「Re:dash」とはPythonとJavaScriptで作られたオープンソースBI(Business Intelligence)ツールです。
まず「BIとはなにか?」ですが、以前より国家の外交や内政の戦略のためにさまざまな情報(Infomation)から、(判断の材料になるような)重要な情報を取り出す「分析」作業の成果物をインテリジェンス(Intelligence)と呼んでいました。例えばアメリカのCIA(中央情報局)はCentral Intelligence Agencyの略です。
この考え方やプロセスのビジネス版がBIです。
BIツールとは、ビジネスにおける経営やリーダーの判断の材料になるような重要な情報を抽出する「分析」のタスクに特化し、その際に便利な機能を提供するツールのことです。
具体的にはビジネスにおける分析のタスクは大枠で分けると「データの深掘り」と「レポーティング」に分けられます。
「データの深掘り」は分析作業そのものともいえますが、見えてる情報をより詳細に分類したり比較したりしてデータの特徴や異常値を見いだしていくタスクです。
「レポーティング」は分析結果を分かりやすく定点観測できるように、まとめたり可視化したりする、報告を目的としたタスクです。
Re:dashは特にレポーティングに便利な機能を有しているツールになります。
グラフ化やダッシュボード化など可視化はもちろん定期実行やアラート機能、またクエリやダッシュボードをURL一つで共有する機能を持ちます。
Re:dashはサーバーサイドのWebアプリケーションで、SalesforceやGoogleアナリティクスのようにブラウザから利用します。
標準機能でデータ格納先への接続機能を備えており、MySQLやPostgreSQLといったRDBMSをはじめ、BigQueryなどの分析向けクラウドサービスやGoogleアナリティクス、Googleスプレッドシートなどにも対応しています。
SQLでクエリを作成することで、データソースからデータ取得します。
本稿ではRe:dashでSQLによるクエリ結果を可視化する手順を確認していきます。