Anthropic, AI 모델로 만 건 이상 보안 취약점 발견

원제: Project Glasswing: An Initial Update

왜 중요한가

AI가 사이버보안 분야에서 인간을 크게 능가하는 성능을 보여주며, 보안 업계의 패러다임 전환을 예고한다.

Anthropic이 Project Glasswing을 통해 Claude Mythos Preview 모델을 활용해 한 달 만에 1만 건 이상의 고위험 보안 취약점을 발견했다고 발표했다. 약 50개 파트너사와 협력해 세계 핵심 소프트웨어의 보안을 강화하는 프로젝트로, 기존 대비 10배 이상 취약점 발견 속도가 향상됐다.

Anthropic은 지난달 출범한 Project Glasswing의 초기 성과를 공개했다. 이 프로젝트는 AI 모델이 악용되기 전에 세계 핵심 소프트웨어의 보안을 확보하는 것이 목표다. Claude Mythos Preview 모델을 사용해 약 50개 파트너사와 함께 한 달간 1만 건 이상의 고위험·치명적 취약점을 발견했다. Cloudflare는 자사 핵심 시스템에서 2,000개 버그(400개는 고위험·치명적)를 발견했으며, 거짓 양성률이 인간 테스터보다 낮다고 평가했다. 대부분 파트너사는 각각 수백 개의 치명적·고위험 취약점을 발견했으며, 버그 발견 속도가 10배 이상 향상됐다고 보고했다. Mozilla는 Firefox 150에서 271개 취약점을 발견해 수정했는데, 이는 Claude Opus 4.6로 Firefox 148에서 발견한 것보다 10배 이상 많은 수치다. 영국 AI Security Institute는 Mythos Preview가 사이버 공격 시뮬레이션을 종단간 해결한 첫 모델이라고 평가했다. Anthropic은 취약점 공개 관례에 따라 90일 후 상세 내용을 공개할 예정이며, 패치 배포 후 더 자세한 학습 결과를 제공할 계획이다.

출처

anthropic.com — 원문 읽기 →