CodeZineを運営する翔泳社では、1月20日(月)にテキスト分析の手法を解説した『現場で使える!Python自然言語処理入門』を発売しました。本書ではAIプロジェクトを経験してきた著者が、テキスト分析の従来型技術とIBM Watsonを用いた新技術について解説。自然言語処理に関心があるエンジニアや理工学生が最初に読むのに適した1冊です。
『現場で使える!Python自然言語処理入門』は、自然言語処理やテキスト分析に関心のある方のために、その概要から従来型の技術、そして商用サービスであるIBM Watsonを利用した新技術について解説した入門書です。
本書で使用する言語はPythonです。機械学習や自然言語処理も扱いやすいのが特徴で、本書ではまず従来型のテキスト分析手法をMecabやElasticsearchといったOSSを利用して解説。それを踏まえ、後半ではIBM Watsonを利用した新しい手法について説明しています。
必要な前提技術として分析対象となるテキスト文の入手方法や形態素解析(日本語を意味のある単語で区切る技術)についても詳しく解説。また、2014年に発表され反響を呼び、今や多くの商用APIで利用されているWord2Vecによるテキスト分析、さらにはテキスト分析の世界を一変させるとも言われる、Googleが発表した画期的な技術であるBERTをわかりやすく紹介しています。
日本アイ・ビー・エムのワトソン事業部で活躍する赤石雅典さんと、Watson導入の提案を手がけてきた江澤美保さんによる本書、実践的な手法を学びたい方におすすめです。
なお、自然言語処理を行うWebアプリを作りながら基本的な技術を習得したい方は『Pythonで動かして学ぶ 自然言語処理入門』もチェックしてみてください。
目次
第1章 テキスト分析とは
第2章 日本語テキスト分析:前処理の勘所
第3章 従来型テキスト分析・検索技術
第4章 商用APIによるテキスト分析・検索技術
第5章 Word2VecとBERT
付録1 実習で利用するコマンド類の導入
付録2 Jupyter Notebookの導入手順
付録3 IBMクラウドの利用手順
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です