Anthropicは2月24日(現地時間)、AIモデルによるリスクを軽減する自主的な枠組み「責任ある拡張方針(Responsible Scaling Policy:RSP)」のバージョン3.0を発表した。
RSPはAIシステムの災害的なリスクを抑えることを目的とし、同社が2年以上運用してきた方針だ。これまでの経験を踏まえ、有効だった措置の強化や、透明性・説明責任向上の新規施策が盛り込まれた。
今回発表されたRSPでは、自社の実施計画と業界全体への推奨事項を明確に分離したうえで、Anthropicが独自に進めるリスク緩和策と、業界が広く採用すべき高水準の安全対策を定義した。また、新たな要素として「Frontier Safety Roadmap」が導入され、セキュリティ・アライメント・各種ガードレール・政策領域ごとのリスク緩和計画と目標が公表される。この目標は実行を強制するものではないが、進捗状況を公開し、透明性を高めている。
さらに、3~6か月ごとにモデルの安全性やリスク緩和策の詳細を評価した「Risk Report」を公開し、リスクや対策の現状と業界推奨におけるギャップも明らかにする。必要に応じて外部の有識者によるレビューも行い、公正さと説明責任を担保する。Anthropicは今後もRSPの改善を継続し、AI技術の発展に応じた柔軟なリスク管理を目指すものとしている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
