Insight Edgeは、LLMを活用したPythonのドキュメント解析ライブラリ「Exparso(エクスパーソ)」を、オープンソースソフトウェア(OSS)として公開したことを、5月30日に発表した。
Exparsoは、PDF・Officeファイル・画像といった非構造データをマルチモーダルLLMで解析して、RAG(Retrieval Augmented Generation)の検索精度と回答品質の向上を実現するPythonのドキュメント解析ライブラリ。
以下のような幅広いドキュメント形式に対応している。
- 文書ファイル:PDF、Word、PowerPoint、テキスト、Markdown
- 画像ファイル:JPEG、PNG、BMP
- 表データ:Excel、CSV
マルチモーダルLLMによる高度な内容理解が可能となっており、ページ単位でドキュメントの種別(テキスト、グラフ、テーブル、画像など)を判別して、特性に応じたプロンプトを生成することで、テキスト情報だけでなく図表の内容やフローチャートが示す意味まで解析できる。
また、多様な形式に対応しており、ビジネスの現場で一般的に利用されるドキュメント形式を網羅する。さらに、今後はHTMLや動画ファイルへの対応も予定しており、解析対象を拡大していく。
あわせて、LLMのトークン制限を超えるファイルも文書を適切に分割・処理可能で、コンテキストを維持したまま情報を抽出して、長文文書でも高精度な理解を実現した。
LangChainにも対応し、AzureChatOpenAI、ChatOpenAI、ChatVertexAI、ChatAnthropicなど、利用環境に応じたLLMと連携できる。
そのほか、精度の高いテキスト抽出によって、RAGシステムでの検索対象データの品質が向上し、最終的な回答生成の精度向上につながる。
Exparsoは、以下のようなユースケースを想定している。
- 社内文書(報告書、契約書、マニュアル、議事録など)からのナレッジ抽出と検索システムへの活用
- 技術文書や研究論文など、図表やフローチャートを多用した文書の解析
- 手書き文字や複雑なレイアウトを含む帳票(請求書、申請書など)からの自動データ入力支援
- 大規模なデータソースを活用したRAGシステムによる基盤構築
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です