機械学習の分野で大きな注目を集めるのが自然言語処理。文章の自動分析などに関心を持つ方も増えています。翔泳社ではまず自分で試してみたい方のために『自然言語処理入門』を1月23日に発売しました。Pythonの利用経験があれば、すぐにでも実践できる内容です。
『Pythonで動かして学ぶ 自然言語処理入門』は、自然言語処理の基本を押さえ、実際に様々な処理を試してみる手法を紹介した入門書です。
自然言語処理は人間が使用する言語をコンピューターに処理させる技術で、人工知能に深く関わる分野です。予測変換などに利用され、ニュースを自動生成させる事例も出てきました。興味を持っている方も多いのではないでしょうか。
本書ではHTMLデータを収集し、 テキストの抽出、クレンジングなどの前準備やデータベースに格納するところから始め、構文解析やテキストマイニングなど基本的な処理の方法をPythonを用いて紹介。テキスト検索ツールを作ったり、テキストの印象を判断する評判分析を行ったりすることができます。
もちろん入門書なので、自然言語処理の知識に自信がない方でもわかりやすい内容になっています。まず体験してみたいときの1冊としておすすめです。
目次
第1章 実行環境を整えよう
第2章 テキストデータを収集しよう
第3章 データベースに格納しよう
第4章 構文解析をしよう
第5章 テキストにアノテーションを付ける
第6章 アノテーションを可視化する
第7章 単語の頻度を数えよう
第8章 知識データを活用しよう
第9章 テキストを検索しよう
第10章 テキストを分類しよう
第11章 評判分析をしよう
第12章 テキストからの情報抽出
第13章 系列ラベリングに挑戦しよう
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です