Anthropicは2月23日(現地時間)、DeepSeek、Moonshot、MiniMaxの3つのAI研究機関による同社AIモデルClaudeへの大規模な「蒸留攻撃」を検出したことを公表した。
「蒸留」とは、本来は強力なAIモデルから出力データを抽出し、より小型のモデルにその知見を学習させる一般的な手法だが、今回は不正に他社モデルから能力を取得する目的で悪用されたとしている。
発表によれば、これらラボは合計約2万4000の不正アカウントを使用し、1600万件超のやり取りを通じて、Claudeの能力抽出を繰り返していた。ターゲットとなったのは主に推論能力やエージェント的なタスク処理、コーディング機能など、Claudeならではの差別化された機能だった。
また、攻撃は組織的かつ巧妙に実行され、大量のプロキシサービスや「ハイドラクラスター」構成を用いて各地域からの規制回避も行われていた。DeepSeekは15万件超で推論能力と検閲回避型の質問処理に注力し、Moonshotは340万件以上で高度な推論やエージェント開発、MiniMaxは1300万件超でコーディング機能にフォーカスした。
同社は、本件により不正蒸留で作られたAIモデルが必要なセーフガードを持たず、国家安全保障上のリスクが高まると警告している。これらの行為に対抗するため、独自の検知・アクセス管理強化、指標共有などで対策を進める一方、業界・政策立案者・AIコミュニティ全体での早急な連携対応を呼びかけている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
