RAGやLLMにできない「似て非なるデータ」の統合、それを実現する「ナレッジグラフ」とは
各ガジェットでサイロ化したデータをまとめて、部分に留まらないAIの活用を進めるにはどうすれば良いだろう。鈴木氏はサイロ化したデータを統合することが難しい背景のひとつを、「データの構造が違うため」と説明する。
生成AIの出力を外部データにより強化するものとして、よく引き合いにだされるのがRAGだ。学習データにないドキュメントやナレッジベースを検索して、より的確な回答を生成することができる。
しかし、この技術にも苦手な分野がある。鈴木氏は人物と住所、電話番号の関係性を例に挙げ、「LLMやRAGだと同姓同名は同じ人物として捉えてしまいます。本当は住所が違えば別人のはずです。ただし引越で住所を変えた可能性もあります。しかし、ここでもしも携帯電話の番号が同じなら、今度は逆に同一人物の可能性が高いです」とその紐づけの難しさを説明する。
業務においては当然、似て非なるものを「同じ」とみなすわけにはいかない。同じか違うか正確に見分けて、さらに言えば判断の根拠を説明できることが不可欠となる。こうしたRAGやLLMが苦手とする課題に対して、DevRevが着目しているのがナレッジグラフだ。
これは、ノードとエッジからなるグラフデータベースのデータ構造をベースに、意味づけされた関係性を説明可能な形で表現する技術だ。これまで検索精度を高める技術として、GoogleやAmazonでも使われてきたが、改めて注目する理由について、RAGやLLMが苦手とする「“似ているけど違う”を区別できる、またなぜその結論を出したのかを説明できる」と鈴木氏は言及する。
DevRevが提供する「Computer」ではナレッジグラフを独自の特許技術「Computer Memory」として実装し、データ構造が異なるものをまとめるために利用している。階層構造やキーバリューが異なる各ガジェット間で、正確に似て非なるものを判別し、データを紐づけることは、RAGやLLMだけでは難しい。「AIの手前でナレッジグラフのようなデータを構造化することに長けた技術を挟んでいます」(鈴木氏)
このように「まとめる役割」を持つナレッジグラフに対して、同社のもう一つの特許技術「Computer AirSync」は、一言で表せばさまざまなSaaSサービスからワンクリックでデータを抽出する技術だ。しかし、その内部で起きている処理は複雑である。
その複雑な処理のひとつが、ユーザー権限の管理だ。多くのSaaSサービスでは、それぞれの役割によって見れる情報を制限できるようになっている。そのユーザー権限に沿いながら、LLMが使いやすい形でデータを引っ張ってくるのが「AirSync」の強みだ。
同社が提供する「Computer」は、ここまでに説明した「Memory」と「AirSync」を背景技術としている。これにより、例えばJira、Salesforce、GitHubなど複数のツールからデータを自動的に結びつけ、ナレッジグラフとして構造化して、AIを最大限活用できる環境を整えるのだ。
統合できるのは構造化データだけに限らず、自然文をはじめとした非構造データも対象だ。例えば議事録や、コミュニケーションツールのチャットもデータ統合の対象となる。これにより、企業内にあるほぼすべての情報を文脈をもったつながりとして統合できる。
鈴木氏はその根底にある考え方として、「情報は、ただ集めるだけではなく、どう流すかが大事です。DevRevはその流れを設計しています。これにより、業務プロセスの変革が実現できるようになります」と説明する。

