『スケーラブルデータサイエンス データエンジニアのための実践Google Cloud Platform』は、理論的な側面だけではなく、実際に利用できるサービス構築をも視野に入れられる“エンジニア”を目指す方のためのガイドです。
もちろん、全エンジニアが本書に描かれているような、意思決定のためのデータ収集からクレンジング、ビジネスサイドからの要求に対応した分析向け各種アルゴリズムの選定から実装、そしてユーザーをミスリードしない、使いやすいインターフェイスの設計までを習得していなければならないわけではありません。とはいえ、真にスケーラブルなサービス(アプリケーション)を構築するには、エンジニア自身もまたスケーラブルであるほうが理想的といえるでしょう。
本書では、580万便以上の実フライトデータから意思決定に必要なWebアプリケーションを作成するまでを、GCPをフル活用しつつ、エンジニアとして必要なスキルとその活用シーンの詳細を解説します。
つまり、統計・分析を活用した意思決定支援システムに必要なノウハウを、カテゴリやジャンルで分断されてはいるけれどエキスパートである方に、あるいはエキスパートをまとめるアーキテクチャの方に、おすすめできる1冊です。
目次
第1章 データに基づくより良い意思決定
第2章 クラウドへのデータの取り込み
第3章 魅力的なダッシュボードを作成する
第4章 ストリーミング・データ処理
第5章 インタラクティブなデータ探索
第6章 Cloud Dataprocによるベイズ分類器
第7章 Spark によるロジスティック回帰分析
第8章 スライディングウインドウによる集計処
第9章 TensorFlowを用いた分類モデル
第10章 リアルタイム機械学習