米Amazon Web Servicesは、Amazon Bedrockにおいて新たにRerank APIの提供を、12月1日(現地時間)に開始した。
Rerank APIを利用することで、開発者は再ランク付けモデルを使用して応答の関連性と精度を改善でき、RAGベースのアプリケーションにおけるパフォーマンスを向上させられる。
RAGアプリケーションでは、取得されたドキュメントとユーザーによるクエリの関連性が、正確な応答を提供する上で重要な役割を果たすことから、セマンティック検索が使用される。また、RAGアプリケーションはベクトルストアから、さまざまな関連ドキュメントを取得している。
一方でセマンティック検索では、ユーザーの好みやクエリコンテキストに基づいて最適なドキュメントを優先順位付けする際に制限があり、この制限はユーザーによるクエリが複雑であいまいであったり、微妙なコンテキストを含む場合などにとりわけ当てはまる。優先順位付けにおける制限によって、ユーザーの質問に部分的にしか関連しないドキュメントが取得される可能性があり、適切な引用とソースの帰属が正しいソースに帰属しないという別の課題が生じることで、RAGアプリケーションの信頼性と透明性が失われてしまう。
こういった制限に対処すべく、将来的にはRAGシステムにおいてユーザーのインテントとコンテキストをよりよく理解できる、堅牢なランキングアルゴリズムの開発が求められている。あわせて、生成された応答の信頼性と透明性を確認すべく、ソースの信頼性評価と引用慣行の改善に取り組むことが重要となる。
高度な再ランク付けモデルでは、クエリと追加のコンテキストについてナレッジベースからもっとも関連性の高いコンテンツを優先して、基盤モデルがもっとも関連性の高いコンテンツを受け取るようにすることで、これらの課題を解決している。この対策によって、より正確でコンテキスト的に適切な応答が得られる。また、生成モデルに送信される情報を優先順位付けすることで、応答生成コストの削減につながる場合もある。
Rerank APIは、現時点で米国西部(オレゴン)、カナダ(中部)、欧州(フランクフルト)、アジアパシフィック(東京)におけるAWSリージョンにて利用可能となっている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です