NTTデータは、オープンソースのデータベース「PostgreSQL」に、高速な全文検索機能を提供する検索エンジン「Ludia」(ルディア)を開発し、オープンソースソフトウエアとして公開を開始した。ソースコードは「SourceForge.jp」で公開中。
NTTデータは、オープンソースで構成されるデータベース「PostgreSQL」に、高速かつ高精度な全文検索機能を提供する検索エンジン「Ludia」(ルディア)を開発し、オープンソースソフトウエアとして公開を開始した。ソースコードは「SourceForge.jp」で公開中。ライセンスはGNU Lesser General Public License (LGPL)で提供される。
データベース内の情報をフリーワードで検索する全文検索機能は、商用データベース管理ソフトでは、以前から存在したが、オープンソースで日本語に対応したものとなると、選択肢が少なくなる。そのため、オープンソースでデータベース内の情報に対する全文検索機能を実現する場合は、データベースからデータを取り出し、別のシステムを構築する必要があるなど、効率的な開発の阻害要因となっていた。
Ludiaは、PostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを、PostgreSQLデータベース内に作成し、商用のデータベース管理ソフトに匹敵する高速かつ高精度な全文検索機能を、シンプルなインタフェースで提供。これにより、PostgreSQL利用システムの構築において、データを分散することなく、データベースの本来の目的であるデータの一元管理を維持しつつ、全文検索機能を実装することが可能となる。
主な機能としては、以下を実装している。
- 二種類の主要な全文検索インデックス方式(N-gram、形態素解析)を共にサポート
- 複数の検索方法(ブーリアン検索、近傍位置検索、類似文書検索)に対応
- 検索した結果が、どの程度期待している結果であるかを示す、「スコア」の取得
NTTデータでは、今後もOSSの開発・公開を通じて、OSSコミュニティへ貢献していくとともに、エンタープライズ市場におけるOSSの活用を積極的に推進していく、としている。
全文検索エンジン「Ludia(TM)」の公開を開始 | ニュースリリース | NTTデータ
SourceForge.jp: Project Info - Ludia
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です