さまざまな分野で需要が高まるデータサイエンスですが、一方で習得して実務で利用するには幅広い知識が求められます。まずは全体像を掴みたいエンジニアにおすすめの書籍『図解まるわかり データサイエンスのしくみ』が、CodeZineを運営する翔泳社より7月22日(金)に発売しました。
『図解まるわかり データサイエンスのしくみ』では、データの値やグラフの種類といった基本から、統計学やAIなどデータサイエンスに不可欠なテーマを図解しています。
データサイエンスは関連する領域が幅広く、データ分析の手法だけでなく個人情報やプライバシーに関する知識も欠かせません。仕事にするために勉強を始めようにも、何から始めればいいかわからないこともあるかもしれません。
本書を読めば基礎から周辺情報まで含めてデータサイエンスの全体像がイメージできるようになり、自分がもっと知りたいこと、あるいは学ぶべきことが見えてくるはずです。
今後業務で必要になりそうな方はもちろん、とりあえず概要を知っておきたい方にも、まず読んでおく入門書として最適です。
目次
第1章 データサイエンスを支える技術~需要が高まる未来の必修科目~
1-1 21世紀の資源
1-2 データが増えている理由
1-3 さまざまな知識を組み合わせて分析する
1-4 データから価値を見いだす職種
1-5 データはそのまま使えない
1-6 大量のデータは宝の山
1-7 人とコンピュータでは扱いやすいデータが異なる
1-8 データのためのデータを知る
1-9 データを1カ所にまとめる
1-10 効率のよい処理手順を考える
1-11 導き出したルールを使えるようにする
1-12 データを扱うプログラミング言語
1-13 誰でも無料で使えるデータ
1-14 楽しみながら分析手法を学ぶ
1-15 ITを中心に考える
1-16 分析されたデータの活用例
1-17 この商品を買っている人はこんな商品も買っています
1-18 データで値づけが変わる
1-19 小さいサイズから実際に試してみる
1-20 継続的に改善を進める
1-21 目標を決め、戦略的に進める
1-22 データに関わる人を把握する
やってみよう データが使われている事例を調べてみよう
第2章 データの基本~データの表現方法と読み方~
2-1 データの種類
2-2 データを範囲で分ける
2-3 グラフを使い分ける
2-4 割合を表すグラフ
2-5 複数のデータを1つのグラフで表現する
2-6 データの基準を作る値
2-7 データの散らばり具合を把握する
2-8 1つの基準で判断する
2-9 不適切なデータを取り扱う
2-10 売上の8割は2割の商品で構成されている?
2-11 視覚的に表現する
2-12 誰でもデータを分析できる便利ツール
2-13 データを一元管理する
2-14 データの連携を考える
2-15 データの構造を可視化する
2-16 データベースを設計する
2-17 紙に印刷されたデータを取り込む
2-18 高い精度でデータを高速に取り込む
やってみよう 伝えたい内容に合ったグラフを選んでみよう
第3章 データの処理と活用~データを分類し、予測する~
3-1 取得するタイミングによって変わるデータ
3-2 プログラムが自動的に出力するデータ
3-3 長期間での変化を捉える
3-4 2つの軸の関係を把握する
3-5 見せかけの関係に騙されない
3-6 複数の軸で集計する
3-7 軸の数を減らして特徴を把握する
3-8 2点間の距離の考え方を知る
3-9 似たような角度を調べる
3-10 データ分析はかっこいい面だけではない
3-11 複数の軸の関係を明らかにする
3-12 高度な回帰分析を知る
3-13 分類を予測する
3-14 知っている知識から値を推定する
3-15 サイコロを振る操作を実現する
3-16 繰り返し予測して精度を高める
3-17 さまざまな分析手法を知る
やってみよう アンケート結果を集計してみよう
第4章 知っておきたい統計学の知識~データから答えを推測する~
4-1 統計学の種類
4-2 データを取り出す
4-3 起こりやすさを数値で表す
4-4 複数のことが同時に起きる確率を考える
4-5 結果から原因を考える
4-6 データの分布を知る
4-7 たくさんのデータを集めれば本来の値に近づく
4-8 関数で分布を表現する
4-9 取り出したデータから元の集団を推測する
4-10 分散がわからない状態で推定する
4-11 統計的に検証する
4-12 正しいと判断する基準を決める
4-13 検定結果を判断する
4-14 平均を検定する
4-15 分散を検定する
やってみよう 身近な食品を使って検定してみよう
第5章 知っておきたいAIの知識~よく使われる手法とそのしくみ~
5-1 人のように賢いコンピュータを作る
5-2 人工知能を実現する手法
5-3 人工知能を評価する指標
5-4 学習の進行状況を把握する
5-5 脳を模倣した学習方法
5-6 少しずつ最適解に近づける
5-7 階層を深くし、大量のデータから学習
5-8 誤差を数値化する
5-9 精度を向上させる
5-10 複数のグループに分割する
5-11 任意の個数に分割する
5-12 木構造で学習する
5-13 複数のAIで多数決を取る
5-14 ルールを評価する指標
5-15 境界線からのマージンを最大化する
5-16 自動的に機械学習を実行する
5-17 さまざまな手法を組み合わせて解決法を見つける
やってみよう 最新の論文を探してみよう
第6章 セキュリティとプライバシーの問題点~データ社会はどこに向かうのか?~
6-1 データを扱う上でのモラルを持つ
6-2 揺らぐデータの信頼性
6-3 誤った認識で揺らぐ精度
6-4 日本における個人情報の扱い
6-5 海外における個人情報の扱い
6-6 個人情報の活用を考える
6-7 データ流通と利活用を考える
6-8 データを扱うときのルールを決める
6-9 何のためにデータを集めるかを明示する
6-10 データが持つ権利を知る
6-11 外部のデータを自動的に取得する
6-12 保有するデータへのアクセスを管理する
6-13 内部からのデータの持ち出しを防ぐ
6-14 何度でも同じ結果が得られる
やってみよう 使っているサービスのプライバシーポリシーを読んでみよう
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社