インターシステムズコーポレーションは、自然言語解析技術「InterSystems iKnow」の日本語対応版「iKnow Japanese」の提供を、データプラットフォーム製品「InterSystems Caché」の組み込み技術として、10月27日に開始した。
「InterSystems iKnow」は、文章(非構造化データ)を意味のあるデータ項目(構造化データ)に変換可能な自然言語解析技術。従来、日本語の言語解析では、あらかじめ定義した辞書やオントロジーに基づく形態素解析が一般的だったが、「InterSystems iKnow」では言語構造をもとに文章そのものから意味のある一連のユニット(エンティティ)を見つけるという、「ボトムアップ手法」による解析を採用している。
「ボトムアップ手法」では、文章の中から意味のある最大単位の「エンティティ」を認識し、「エンティティ」同士の関連性を示す近接性(Proximity)や、文章内の特定の「エンティティ」の優位性(Dominance)を算出し、非構造化データの内容を理解・活用できるほか、辞書やオントロジーの定義、およびそれらのメンテナンスを行う必要がなく、検索対象が不明な場合でも、文章の本質がわかる。
【関連リンク】
・インターシステムズジャパン
・「InterSystems Caché」
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です