Elasticsearchを用いた日本語検索システムの理論と設定
Elasticsearchと対話Botによる対話型の検索システム 第1回
ダウンロード サンプルファイル (4.6 KB)
本連載は、対話インターフェースを利用して新しい形の検索システムを体験してもらうことを目的としています。今回は日本語検索システムでよく用いられるElasticsearchを紹介します。Elasticsearchは大規模なデータに対しても適用可能な検索機能を提供している全文検索エンジンです。特徴としてスケーラブル、検索速度の速さ、検索結果の分析のしやすさ、開発者にとって使いやすいRESTfulなAPIが挙げられます。今回の記事はElasticsearchを用いた日本語検索システムの仕組みから設定の部分までを記述し、次回の記事で実際に動作させてもらいます。

目次 |
---|
修正履歴
2016/10/11 11:57 サンプルファイルを差し替えました。
2016/10/09 18:16 Page 1 検証環境を追記
2016/10/09 18:16 ElasticsearchCode/elasticsearch.ymlの「min_gram」と「max_gram」を同一の値である2に修正
2016/10/09 18:15 Page 3 「2gramの例」 例を「これは例文です。→ これ は例 文で す。」から「これは例文です。→ これ れは は例 例文 文で です す。」に修正
2016/10/09 18:15 Page 3 「mecab」を「kuromoji」に修正
2016/10/09 18:15 Page 3 「mecab neologd」を「kuromoji neologd」に修正
2016/10/09 18:15 Page 2 ステミングの設定 kuromoji_neologd_stemmerの例をカタカナの長音をステミングするための設定に修正
バックナンバー
Elasticsearchを用いた日本語検索システムの理論と設定
Article copyright © 2016 Ogushi Masaya, WINGS Project, Shoeisha Co., Ltd.