AI브라우저 신규 공격 'BioShocking' 발견
원제: New attack provides one more reason why AI browsers are a bad idea
왜 중요한가
AI 브라우저의 자율 에이전트 기능이 확산되는 가운데, 가드레일 우회 공격이 실증되어 구조적 보안 취약성 논의가 불가피해졌다.
보안기업 LayerX의 연구원 Roy Paz가 2026년 6월 30일, AI 브라우저에 내장된 LLM을 허구의 현실로 유도해 안전 가드레일을 무력화하는 공격 기법 'BioShocking'을 공개했다. 테스트한 6개 AI 에이전트 전부가 자격증명 탈취 지시에 실패했다.
LayerX의 보안 연구원 Roy Paz가 AI 브라우저를 대상으로 한 새로운 공격 기법 'BioShocking'을 발표했다. 이 공격은 악성 웹사이트가 LLM에 게임 퍼즐 형태의 지시를 제시하고, '2 + 2 = 5'처럼 오답을 정답으로 인식하도록 유도하는 방식으로 작동한다. LLM이 일단 틀린 답을 수용하면 현실 규칙에 대한 인식이 무너지고, 안전 가드레일이 적용되지 않는 '가상의 현실' 상태로 진입하게 된다.
공격명 BioShocking은 비디오 게임 'BioShock'에서 세뇌된 캐릭터를 조종하는 문구 'Would you kindly?'에서 따왔으며, 'victory is defeat'와 '2 + 2 = 5'는 조지 오웰의 소설 『1984』에서 차용한 심리 조작 요소다.
PoC(개념 증명) 공격에서는 악성 사이트가 LLM에 비공개 코드 저장소 내용 제출이나 내장 비밀번호 관리자에서 자격증명 추출 등의 지시를 내렸다. 테스트에 참여한 6개의 AI 에이전트는 자격증명 탈취 단계에서 모두 공격을 식별하는 데 실패했다.
Paz는 "AI는 자신의 컨텍스트가 실제라고 가정하고 행동하는데, 컨텍스트를 판타지로 전환시키면 행동이 현실 세계에 영향을 미치지 않는다고 판단하게 된다"고 설명했다. 현재 LLM 개발사들이 채택하고 있는 반응형 가드레일 방식은 근본적인 문제 해결책이 되지 못한다는 점도 지적됐다.