Shoeisha Technology Media

CodeZine(コードジン)

記事種別から探す

目的別の設計からデータ解析の手法も!『Pythonによるクローラー&スクレイピング入門』

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2017/10/23 07:00

 Web上にある自社製品への言及やアプリのクラッシュ情報などを、クローラーで自動収集し、改善や分析に役立てる企業が増えています。翔泳社ではクローラー需要に応え、『Pythonによるクローラー&スクレイピング入門』を10月23日に発売しました。まだクローラーの知識がない方でも、すぐに実装できるようになるお勧めの1冊です。

Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析まで』は、際限なく増え続けるWeb上の情報から有益なものを収集し、活用するためのクローラーとスクレイピングの基礎知識をまとめた入門書です。

 本書ではライブラリが非常に充実しているPythonを用いて、開発環境の準備から目的別のクローラーを作成する方法までひととおり解説。ちょっとしたクローリングをするときに便利なOSSのWgetも使ってみます。

 Pythonでクローラーを設計するといっても、HTMLやRSS、クローリングしづらいページなど対象は多種多様。そんなときに使えるノウハウを紹介しています。また、収集したデータを保存・管理する方法も解説しました。

 さらにクローラーの保守・運営、データの活用方法も説明。クローリングとスクレイピングだけのテクニックではなく、データ収集から活用までを学ぶことができます。収集を自動化したいと思っていた、効率よく情報収集したい――そんな方に取り組んでみてもらいたい1冊です。

 クローリングについてもっと深く学びたい方は『クローリングハック』を、Pythonを基礎から勉強したい方には『スラスラわかるPython』もお勧めします。

 また今回、本書を購入していただいた方全員に特典(PDF)をプレゼント。クローリングとスクレイピングを行う際に役立つPythonのライブラリ集です。

 充実したライブラリを活用し、Python製クローラーを開発し、運用してみてください!

購入特典をチェック

目次

Part 1 基本編

Chapter 1 クローラーとスクレイピングを体験する
Chapter 2 クローラーを設計する
Chapter 3 クローラーおよびスクレイピングの開発環境の準備とPythonの基本
Chapter 4 スクレイピングの基本

Part 2 応用編

Chapter 5 クローラーの設計・開発(応用編)
Chapter 6 スクレイピングの開発(応用編)
Chapter 7 クローラーで集めたデータを利用する
Chapter 8 クローラーの保守・運用
Chapter 9 目的別クローラー&スクレイピング作成手法

Appendix クローラー&スクレイピングに役立つライブラリ

Amazon SEshop その他


Pythonによるクローラー&スクレイピング入門
設計・開発から収集データの解析まで

著者:加藤勝也、横山裕季
発売日:2017年10月23日(月)
価格:3,240円(税込)

本書について

クローラーの概要とPythonによる開発環境の準備から始まり、クローラーの作成、集めたデータから必要な情報を抽出する手法するスクレイピングの基本、そして運用・管理方法といった応用的な内容も網羅しています。

 



  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 渡部 拓也(ワタナベ タクヤ)

     翔泳社マーケティング広報課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。 Twitter@tiktakbeam

バックナンバー

連載:翔泳社 新刊紹介

もっと読む

All contents copyright © 2005-2017 Shoeisha Co., Ltd. All rights reserved. ver.1.5