ホワイトハウス、Anthropicの全ジェイルブレーク遮断を要求か
原題: The White House Wants Anthropic to Block All Jailbreaks. That May Not Be Possible
なぜ重要か
AI規制とセキュリティ対策の現実的課題が表面化。政府とAI企業の間で実現不可能な要件が争点となり、AI産業の国家安全保障ポリシーの方向性に影響を与える可能性がある。
トランプ政権がAnthropicに対し、高度なAIモデル「Claude Fable 5」の再リリースを条件に、すべてのジェイルブレーク(プロンプトを利用したセーフガード回避方法)の完全遮断を要求していることが明らかになった。セキュリティ専門家は、こうした要求は実現不可能だと指摘している。
トランプ政権とAnthropicの対立が急速に深刻化している。政権幹部がWIREDに対し、先週エクスポートコントロールで停止されたClaude Fable 5の再リリースには、政府が指摘する脆弱性に対処する必要があると述べた。
Anthropicは数日前から、政府の懸念は過大評価だと主張し、ジェイルブレークの影響は最小限だと表明していた。同社は月曜日に商務省および国家サイバー責任者Sean Cairncrossとの技術会議でもこの立場を繰り返した。
しかし、政府関係者は議論の段階は過ぎたと述べている。国家安全保障局(NSA)がFable 5のセーフガードを無効化する方法が存在することを確認したため、問題はAnthropicの責任だと考えている。セーフガードはMythosモデルのサイバーセキュリティ、化学、生物学関連機能へのアクセスを制限するために設置されている。
政権は、Anthropicが市場に出すすべてのフロンティアAIモデルについて、継続的にジェイルブレークをテストし、発見したものを政府に自発的に報告する、より積極的なアプローチを取るべきだと考えている。商務省のAI標準イノベーションセンターとNSAは、すべてのモデルのあらゆる可能性のあるジェイルブレーク対応に携わる人員と予算を持っていないという。
独立系サイバーセキュリティ専門家は、AIモデルのセーフガードは一時的な解決策に過ぎず、熟練ユーザーと将来のAIモデルは制約を回避する方法を見つけるだろうと指摘している。つまり、ホワイトハウスが要求しているように見えることは実現不可能だという見方が広がっている。