CodeZine(コードジン)

特集ページ一覧

データの基本からAIと個人情報の扱いまで、全体像を掴める『図解まるわかり データサイエンスのしくみ』

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2022/07/22 07:00

 さまざまな分野で需要が高まるデータサイエンスですが、一方で習得して実務で利用するには幅広い知識が求められます。まずは全体像を掴みたいエンジニアにおすすめの書籍『図解まるわかり データサイエンスのしくみ』が、CodeZineを運営する翔泳社より7月22日(金)に発売しました。

 『図解まるわかり データサイエンスのしくみ』では、データの値やグラフの種類といった基本から、統計学やAIなどデータサイエンスに不可欠なテーマを図解しています。

 データサイエンスは関連する領域が幅広く、データ分析の手法だけでなく個人情報やプライバシーに関する知識も欠かせません。仕事にするために勉強を始めようにも、何から始めればいいかわからないこともあるかもしれません。

 本書を読めば基礎から周辺情報まで含めてデータサイエンスの全体像がイメージできるようになり、自分がもっと知りたいこと、あるいは学ぶべきことが見えてくるはずです。

 今後業務で必要になりそうな方はもちろん、とりあえず概要を知っておきたい方にも、まず読んでおく入門書として最適です。

目次

第1章 データサイエンスを支える技術~需要が高まる未来の必修科目~
1-1 21世紀の資源
1-2 データが増えている理由
1-3 さまざまな知識を組み合わせて分析する
1-4 データから価値を見いだす職種
1-5 データはそのまま使えない
1-6 大量のデータは宝の山
1-7 人とコンピュータでは扱いやすいデータが異なる
1-8 データのためのデータを知る
1-9 データを1カ所にまとめる
1-10 効率のよい処理手順を考える
1-11 導き出したルールを使えるようにする
1-12 データを扱うプログラミング言語
1-13 誰でも無料で使えるデータ
1-14 楽しみながら分析手法を学ぶ
1-15 ITを中心に考える
1-16 分析されたデータの活用例
1-17 この商品を買っている人はこんな商品も買っています
1-18 データで値づけが変わる
1-19 小さいサイズから実際に試してみる
1-20 継続的に改善を進める
1-21 目標を決め、戦略的に進める
1-22 データに関わる人を把握する
やってみよう データが使われている事例を調べてみよう

第2章 データの基本~データの表現方法と読み方~
2-1 データの種類
2-2 データを範囲で分ける
2-3 グラフを使い分ける
2-4 割合を表すグラフ
2-5 複数のデータを1つのグラフで表現する
2-6 データの基準を作る値
2-7 データの散らばり具合を把握する
2-8 1つの基準で判断する
2-9 不適切なデータを取り扱う
2-10 売上の8割は2割の商品で構成されている?
2-11 視覚的に表現する
2-12 誰でもデータを分析できる便利ツール
2-13 データを一元管理する
2-14 データの連携を考える
2-15 データの構造を可視化する
2-16 データベースを設計する
2-17 紙に印刷されたデータを取り込む
2-18 高い精度でデータを高速に取り込む
やってみよう 伝えたい内容に合ったグラフを選んでみよう

第3章 データの処理と活用~データを分類し、予測する~
3-1 取得するタイミングによって変わるデータ
3-2 プログラムが自動的に出力するデータ
3-3 長期間での変化を捉える
3-4 2つの軸の関係を把握する
3-5 見せかけの関係に騙されない
3-6 複数の軸で集計する
3-7 軸の数を減らして特徴を把握する
3-8 2点間の距離の考え方を知る
3-9 似たような角度を調べる
3-10 データ分析はかっこいい面だけではない
3-11 複数の軸の関係を明らかにする
3-12 高度な回帰分析を知る
3-13 分類を予測する
3-14 知っている知識から値を推定する
3-15 サイコロを振る操作を実現する
3-16 繰り返し予測して精度を高める
3-17 さまざまな分析手法を知る
やってみよう アンケート結果を集計してみよう

第4章 知っておきたい統計学の知識~データから答えを推測する~
4-1 統計学の種類
4-2 データを取り出す
4-3 起こりやすさを数値で表す
4-4 複数のことが同時に起きる確率を考える
4-5 結果から原因を考える
4-6 データの分布を知る
4-7 たくさんのデータを集めれば本来の値に近づく
4-8 関数で分布を表現する
4-9 取り出したデータから元の集団を推測する
4-10 分散がわからない状態で推定する
4-11 統計的に検証する
4-12 正しいと判断する基準を決める
4-13 検定結果を判断する
4-14 平均を検定する
4-15 分散を検定する
やってみよう 身近な食品を使って検定してみよう

第5章 知っておきたいAIの知識~よく使われる手法とそのしくみ~
5-1 人のように賢いコンピュータを作る
5-2 人工知能を実現する手法
5-3 人工知能を評価する指標
5-4 学習の進行状況を把握する
5-5 脳を模倣した学習方法
5-6 少しずつ最適解に近づける
5-7 階層を深くし、大量のデータから学習
5-8 誤差を数値化する
5-9 精度を向上させる
5-10 複数のグループに分割する
5-11 任意の個数に分割する
5-12 木構造で学習する
5-13 複数のAIで多数決を取る
5-14 ルールを評価する指標
5-15 境界線からのマージンを最大化する
5-16 自動的に機械学習を実行する
5-17 さまざまな手法を組み合わせて解決法を見つける
やってみよう 最新の論文を探してみよう

第6章 セキュリティとプライバシーの問題点~データ社会はどこに向かうのか?~
6-1 データを扱う上でのモラルを持つ
6-2 揺らぐデータの信頼性
6-3 誤った認識で揺らぐ精度
6-4 日本における個人情報の扱い
6-5 海外における個人情報の扱い
6-6 個人情報の活用を考える
6-7 データ流通と利活用を考える
6-8 データを扱うときのルールを決める
6-9 何のためにデータを集めるかを明示する
6-10 データが持つ権利を知る
6-11 外部のデータを自動的に取得する
6-12 保有するデータへのアクセスを管理する
6-13 内部からのデータの持ち出しを防ぐ
6-14 何度でも同じ結果が得られる
やってみよう 使っているサービスのプライバシーポリシーを読んでみよう

図解まるわかり データサイエンスのしくみ

Amazon  SEshop  その他

 
図解まるわかり データサイエンスのしくみ

著者:増井敏克
発売日:2022年7月22日(金)
定価:1,848円(本体1,680円+税10%)

本書について

本書では、データやグラフの種類、統計学の基本など、基礎から周辺知識まで、データサイエンスを学ぶ際に知っておきたいことを一通り解説しています。



  • LINEで送る
  • このエントリーをはてなブックマークに追加

バックナンバー

連載:翔泳社 新刊紹介

もっと読む

著者プロフィール

  • 渡部 拓也(ワタナベ タクヤ)

     翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。

あなたにオススメ

All contents copyright © 2005-2022 Shoeisha Co., Ltd. All rights reserved. ver.1.5