高精度全文検索エンジン「Senna 1.0.0」が、23日リリースされた。当初2006年7月にリリースされる予定だったが、遅れての登場となる。
「Senna」は(有)未来検索ブラジルにより開発が進められていた組み込み式の検索エンジンで、MySQLに組み込む形で使用する(Senna単体をCなどから使用することもできる)。MySQLは日本語の全文検索を苦手としているが、Sennaを使うと簡単、高精度、即時検索の全文検索が可能になる。
一般に日本語の全文検索は分かち書き(例えば、「今日は晴れです」という文章を「今日」「は」晴れ」「です」と分けること)してインデックス化しておく必要がある。Sennaでは自動的に分かち書き方式で文章をインデックス化、完全一致検索を行うことで高精度化を実現した。また、完全一致する件数が少ない場合は、自動的に部分検索も行い、精度の向上に役立てている。
SennaはSourceForge.jpより、無償でダウンロードすることができる。
Senna 組み込み型全文検索エンジン
住商情報システムMySQLとSennaによる日本語全文検索のご紹介(PDF)