情報処理推進機構(IPA)のAIセーフティ・インスティテュート(AISI)は、2024年9月に公開した「AIセーフティに関するレッドチーミング手法ガイド」を、具体的な実施例を通してより詳細に理解できるよう改訂したことを、4月2日に発表した。
「AIセーフティに関するレッドチーミング手法ガイド」は、AIシステムの開発者や提供者が対象のAIシステムに施したリスクへの対策を、攻撃者の視点から評価するためのレッドチーミング手法に関する基本的な考慮事項を示すものとして公開されている。一方で、レッドチーミングの実施には高い専門性が求められることから、公開時点ではより実践的なガイドにする必要があった。
今回の改訂では、RAG(Retrieval-Augmented Generation)の仕組みを実装したAIシステムに対して実際にレッドチーミングを行い、その手順を詳細に解説するとともにレッドチーミング実施の成果物を文書としてとりまとめている。これらは、別紙および別添として同ガイドに追加された。

この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です