危険なAIモデルは必ず出現する

原題: ‘Dangerous’ AI Models Are Coming No Matter What

なぜ重要か

複数企業によるAI高度機能の並行開発進行を示唆し、単一企業への規制では意味をなさない現実を浮き彫りにする。AI安全保障と技術進歩のバランスに関わる重要な政策課題。

米国政府がAnthropicのClaude Fable 5とMythos 5の利用を制限したが、専門家は同様の高度なハッキング能力を持つAIモデルが複数企業から近い将来に登場することは避けられないと指摘。Anthropicは4月のMythos debut以来、脆弱性発見と悪用の両方に使える二重用途の能力を警告している。

Anthropicは先週、米国政府の輸出管理指令に従い、新型AIモデルClaude Fable 5とMythos 5をオフラインにした。指令は「外国籍者」による利用を禁止するもので、同社は現在ホワイトハウスと協議中だが、再開の合意はまだ成立していない。

Mythos 5とClaude Fable 5は、ソフトウェア脆弱性を発見するだけでなく、それを悪用する方法も特定できる高度な能力を持つ。Anthropicはこの二重用途性を認識し、初期段階ではProject Glasswingという作業部会に限定して「Mythos Preview」をリリース。Mythos 5も同グループに非公開で提供され、Claude Fable 5は一般公開時にサイバーセキュリティと生物学に関する質問への回答をブロックする安全装置を実装していた。

しかし先週末、トランプ政権はFable 5のガードレールが外せるリスクを理由に両モデルの制限を実行した。

一方、セキュリティ専門家は異なる見方を示す。TPO Group最高セキュリティ責任者のTarah Wheeler氏は「Anthropicと同等の機能を持つ競合企業が他に存在しない、あるいは既に開発されていないと考えるのは極めて近視眼的」と指摘。他企業も同様の能力を保有しており、現在の規制環境を見守りながら公開を控えている可能性があると述べた。

AnthropicのLogan Graham frontier red team leadは4月のインタビューで「問題はモデルやAnthropicではなく、6~24カ月以内にこれらの能力が広く利用可能になる世界への準備が必要」と強調。OpenAIも4月中旬に同様のサイバーセキュリティ専門モデルを非公開でリリースし、サイバーセキュリティ戦略を拡大したと発表している。

研究者らはさらに、次世代モデルが登場する前から、既存のAIツールも精密なハーネスを使えば脆弱性発見と悪用開発に利用可能と指摘している。

出典

wired.com — 元記事を読む →