危険なAIモデルは必ず登場する

原題: "Dangerous" AI models are coming no matter what

なぜ重要か

先進的なAI能力の規制が困難になる実態を示唆。複数企業による開発競争が加速する中、単一企業への制限では対抗できない可能性が業界全体の課題として浮上。

Anthropicが高度なハッキング能力を持つClaude Fable 5とMythos 5をオフラインにした。米国政府の輸出規制指令による措置。同社は高度な脆弱性発見・悪用能力を持つMythos 5について、サイバーセキュリティ専門家と悪質な行為者の両方に利用される可能性がある「双方向の剣」と指摘している。

Anthropicは先週、米国政府の輸出規制指令に基づき、新型AIモデルのClaude Fable 5とMythos 5をオフラインにした。同指令は「外国籍者」のサービス利用を禁止しており、ホワイトハウスとの交渉は継続中だが、まだ合意に至っていない。

Mythos 5は4月の登場以来、ソフトウェア脆弱性の発見と悪用方法の特定を両方実行できる高度な能力があるとAnthropicが警告している。Anthropicはこの双方向の性質を認識し、Mythos Preview版をProject Glasswingと呼ばれる特定の作業グループのコンソーシアムに限定して公開していた。Mythos 5も同グループにのみ非公開で配布され、Claude Fable 5は一般向けにリリースされたが、生物学とサイバーセキュリティに関する質問への回答ブロックが実装されていた。

トランプ政権は週末に両モデルを制限する措置を取った。Fable 5のセーフガードが無効化され、Mythos 5の完全なアクセスが可能になる可能性があるという国家安全保障上の懸念からである。しかし専門家は、この制度的衝突は基本的な事実を遅延させるか隠蔽しているだけだと指摘している。複数企業やオープンウェイト開発者のモデルは、近い将来Mythos 5と同等の能力を持つようになる、あるいはすでに持っている可能性が高いということだ。

TPO Groupのセキュリティ責任者Tarah Wheelerは「Anthropicの競合他社が同様の能力を開発していない、あるいはすでに開発していないと考えるのは極度に短視的」とコメント。「他の企業も同等の能力を持っており、現在の規制環境でAnthropicがどのように扱われるかを見守りながら温存している可能性がある」と述べた。

AnthropicはMythos Preview発表時から「これはモデルやAnthropicについてではなく、6カ月から24カ月以内にこれらの能力が広く利用可能な世界に備える必要がある」と強調してきた。OpenAIも4月中旬にサイバーセキュリティ専門のモデルの非公開配布を行っている。

出典

arstechnica.com — 元記事を読む →