小規模AIモデルもMythosが発見した脆弱性を検出可能と判明

原題: Small models also found the vulnerabilities that Mythos found

Anthropic社が発表したAIサイバーセキュリティモデル「Mythos」の検証で、36億パラメータの小規模モデルでもMythosが発見したFreeBSD脆弱性を検出できることが判明。AISLE社が8つの小規模オープンモデルで検証し、全てが同等の分析結果を示した。セキュリティ分野でのAI能力は不安定で、システム全体の専門性が重要との結論。

2026年4月7日、Anthropic社は限定アクセスのAIモデル「Mythos」と、重要ソフトウェアの脆弱性発見・修正を目的とするコンソーシアム「Project Glasswing」を発表した。同社は1億ドルの使用クレジットと400万ドルの直接寄付を約束し、Mythosが主要OSやブラウザで数千のゼロデイ脆弱性を自律的に発見したと報告した。具体例として、OpenBSDの27年前のバグ、FFmpegの16年前のバグ、FreeBSDに対するリモートコード実行エクスプロイトの自律的作成などが挙げられた。

AISLE社は検証のため、Mythosが発見した特定脆弱性を小規模なオープンウェイトモデルでテストした。結果、36億の活性パラメータを持つモデル(100万トークンあたり0.11ドル)を含む8つ全てのモデルが、Mythosの主力成果であるFreeBSD脆弱性を検出した。また、51億活性パラメータのオープンモデルが27年前のOpenBSDバグの核心部分を発見し、基本的なセキュリティ推論タスクでは小規模オープンモデルが主要ラボの最先端モデルを上回る性能を示した。

これらの結果から、サイバーセキュリティにおけるAI能力は「ジャギー」(不安定)であり、モデルサイズに比例して向上しないことが判明した。重要なのは深いセキュリティ専門知識が組み込まれたシステム全体であり、モデル単体ではないとの結論に至った。

なぜ重要か

AIサイバーセキュリティ分野で高額な大規模モデルが必須ではなく、小規模モデルでも実用的成果が得られることを実証

出典

aisle.com — 元記事を読む →

※ 本記事は海外メディアの公開情報を元に編集部が日本語で要約したものです。投資判断の推奨ではありません。