分業化が進むことで個別分野のエキスパートは増え、各問題に対する即応度は高まった感はあるものの、膨大なデータを背景にした意思決定のさらなる高速化が求められる現代においては、独立性の高い分業形態では追いつかないケースが増えています。翔泳社から6月5日に発売した『スケーラブルデータサイエンス』は、そのようなニーズに応えられるデータエンジニアとして、GCPを援用することで自身をスケールアップする方法を解説しています。
『スケーラブルデータサイエンス データエンジニアのための実践Google Cloud Platform』は、理論的な側面だけではなく、実際に利用できるサービス構築をも視野に入れられる“エンジニア”を目指す方のためのガイドです。
もちろん、全エンジニアが本書に描かれているような、意思決定のためのデータ収集からクレンジング、ビジネスサイドからの要求に対応した分析向け各種アルゴリズムの選定から実装、そしてユーザーをミスリードしない、使いやすいインターフェイスの設計までを習得していなければならないわけではありません。とはいえ、真にスケーラブルなサービス(アプリケーション)を構築するには、エンジニア自身もまたスケーラブルであるほうが理想的といえるでしょう。
本書では、580万便以上の実フライトデータから意思決定に必要なWebアプリケーションを作成するまでを、GCPをフル活用しつつ、エンジニアとして必要なスキルとその活用シーンの詳細を解説します。
つまり、統計・分析を活用した意思決定支援システムに必要なノウハウを、カテゴリやジャンルで分断されてはいるけれどエキスパートである方に、あるいはエキスパートをまとめるアーキテクチャの方に、おすすめできる1冊です。
目次
第1章 データに基づくより良い意思決定
第2章 クラウドへのデータの取り込み
第3章 魅力的なダッシュボードを作成する
第4章 ストリーミング・データ処理
第5章 インタラクティブなデータ探索
第6章 Cloud Dataprocによるベイズ分類器
第7章 Spark によるロジスティック回帰分析
第8章 スライディングウインドウによる集計処
第9章 TensorFlowを用いた分類モデル
第10章 リアルタイム機械学習
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です