データ分析の勉強をしたいとき、自分がどれくらいの知識を学べたのか、実践で役立てられるのかと不安になることがあるかもしれません。あるいは、勉強のモチベーションが保てず挫折してしまうことも。そんなときに挑戦してみてほしいのが、データ分析コンペ「Kaggle」です。CodeZineを運営する翔泳社では、Kaggleを通してデータ分析を学ぶ『Pythonで動かして学ぶ!Kaggleデータ分析入門』を10月22日(木)に発売しました。
『Pythonで動かして学ぶ!Kaggleデータ分析入門』は、データ分析コンペ「Kaggle」に挑戦しながら基礎知識を学び、自分の知識やその正確さを試せるデータ分析の入門書です。
本書では初心者向けのチュートリアルとなる「Titanicコンペ」と「House Pricesコンペ」を取り上げており、その準備に必要な知識から、分析の手順、さらに結果の考察とより精度を高めるためのプロセスについてPythonのコードとともに解説しています。
-
Titanicコンペの特徴
乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、生存したか死亡したかのフラグとともに与えられています。
生死に影響する属性の傾向をデータから分析して、生死がわからない(予測用に隠されている)乗客について、生死結果を予測することが目的です。
-
House Pricesコンペの特徴
与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、79個の説明変数および、目的変数としての物件価格を含みます。
1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、1459戸の家の価格を予測します。
Kaggleに関心がある方はもちろん、データ分析の基礎を習得したい方にもおすすめの本書。仕事で役立つ知識を効率よく学びたいときに読んでみてください。
目次
Prologue:Kaggleで実践的なスキルを体験しよう!
Chapter1:Kaggleとは
Chapter2:データ分析の手順、データ分析環境の構築
Chapter3:Kaggleコンペにチャレンジ(1):Titanicコンペ
Chapter4:Kaggleコンペにチャレンジ(2):House Pricesコンペ
Chapter5:さらなるデータサイエンス力向上のためのヒント
Appendix:Kaggle Days ToKyo 2019 レポート
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です