SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

翔泳社 新刊紹介

機械学習に必須の「きれいなデータ」を用意するために 『現場で使える!pandasデータ前処理入門』発売

  • X ポスト
  • このエントリーをはてなブックマークに追加

  • X ポスト
  • このエントリーをはてなブックマークに追加

 CodeZineを運営する翔泳社では、4月20日(月)に『現場で使える!pandasデータ前処理入門』を発売しました。本書では機械学習やデータサイエンスにおいて欠かせない「データ前処理」をPythonのライブラリ「pandas」で行う手法について解説。作業に必要な「きれいなデータ」をできるだけ効率よく用意してしまいましょう。

現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 』は、機械学習やデータサイエンスに欠かせない「きれいなデータ」を作る手法を解説した入門書です。

 本書では機械学習で人気のPythonを用い、データ前処理においてもはや必須と言われるライブラリ「pandas」の使い方を説明します。データを活用するにしても、収集された生のデータは欠損値や外れ値などが混ざっておりそのままでは利用できません。このデータを前処理していかに利用しやすい形に整えるか、それが作業の効率を決めると言っても過言ではないでしょう。

 将来的に、収集されるデータは種類も量も増えていきます。機械学習エンジニアやデータサイエンティストにとって、そのデータをうまく活用できるかどうかが腕の見せどころ。

 そのためにも、データ前処理の手法をしっかり理解しておくことが必要です。ぜひ本書をその基礎作りの一助としてください。

目次

第1章 pandasの概要とPythonの基本操作
第2章 pandasのデータ構造
第3章 データ参照と読み込み
第4章 データ集計と並び替え
第5章 データ変形
第6章 欠損値・外れ値・重複データ
第7章 関数適用とグループ化
第8章 その他の操作
第9章 データ分析の基本

現場で使える!pandasデータ前処理入門

Amazon SEshop その他

現場で使える!pandasデータ前処理入門
機械学習・データサイエンスで役立つ前処理手法

著者:株式会社ロンバード
発売日:2020年4月20日(月)
価格:3,800円+税

本書について

本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。

 

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
翔泳社 新刊紹介連載記事一覧

もっと読む

この記事の著者

渡部 拓也(ワタナベ タクヤ)

 翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/12145 2020/04/20 07:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング