위험한 AI 모델, 규제 불구하고 확산 불가피

원제: "Dangerous" AI models are coming no matter what

왜 중요한가

AI의 듀얼유스 특성과 기술 확산 추세 속에서 단일 기업 규제의 한계를 노출. 업계 전반의 규제 정책 재정립이 시급한 상황.

Anthropic이 미국 정부의 수출규제 지시에 따라 해킹 능력을 갖춘 Claude Fable 5와 Mythos 5 모델을 오프라인 전환했다. 전문가들은 이러한 조치가 근본적인 문제를 미루고 있을 뿐, 향후 6~24개월 내 유사 기능의 AI 모델이 여러 기업과 오픈소스 개발자로부터 광범위하게 출현할 것으로 예측한다.

Anthropic은 지난주 미국 정부의 수출통제 지시에 따라 고급 해킹 능력을 가진 신규 AI 모델 Claude Fable 5와 Mythos 5를 서비스에서 제거했다. 백악관과의 협상이 진행 중이지만 아직 합의에 이르지 못했다.

Mythos는 지난 4월 출시 이후 소프트웨어 취약점 발견뿐 아니라 악의적 행위자가 악용할 수 있는 방식으로 이를 공략하는 고급 기능을 갖추고 있다고 Anthropic이 경고했다. 회사는 이러한 양면성을 인정하며 "사이버보안 전문가와 생물학 연구자에게 유용한 쿼리가 악의적 행위자에게는 위험할 수 있다"고 밝혔다.

이에 따라 Mythos Preview는 프로젝트 Glasswing 워킹그룹에만 제한 공개했고, Mythos 5도 같은 그룹에만 비공개 공개했다. Claude Fable 5는 생물학과 사이버보안 질문에 대한 응답을 차단한 상태로 일반에 공개했다. 그러나 트럼프 행정부는 Fable 5의 안전장치가 우회돼 Mythos 5의 전체 기능 접근이 가능하다고 판단하여 제한 조치를 취했다.

전문가들은 이러한 규제 충돌이 근본 현실을 외면하고 있다고 지적한다. TPO Group의 최고보안책임자 Tarah Wheeler는 "다른 경쟁사들도 Mythos와 유사한 능력을 개발했거나 현재의 규제 환경이 어떻게 전개될지 지켜보며 보유하고 있을 가능성이 높다"고 말했다. Anthropic은 6~24개월 내 이러한 기능이 광범위하게 이용 가능해질 것으로 예상했다. OpenAI도 지난 4월 중순 사이버보안 중심 모델의 비공개 공개를 진행했다.

출처

arstechnica.com — 원문 읽기 →