Claude Fable 5, 자율적 브라우저 조작으로 버그 분석

원제: Claude Fable is relentlessly proactive

왜 중요한가

AI가 단순 질의응답을 넘어 복합적 문제해결을 위한 자율적 도구 활용 능력을 보여준 사례

Anthropic의 Claude Fable 5가 웹 개발 디버깅 과정에서 스크린샷, HTML 파일 생성, 브라우저 자동화, JavaScript 주입 등을 통해 자율적으로 UI 버그를 분석하는 모습이 공개됐다. 사용자가 명시적으로 요청하지 않은 고급 기능들을 스스로 활용해 문제를 해결했다.

개발자 Simon Willison이 Claude Fable 5를 사용해 Datasette Agent의 수평 스크롤바 버그를 분석하는 과정을 공유했다. 단순히 스크린샷을 제공하고 의존성을 확인해달라고 요청했지만, Claude는 예상을 뛰어넘는 방식으로 문제에 접근했다.

Claude는 먼저 Python과 pyobjc-framework-Quartz를 활용해 macOS의 모든 창을 스캔하고 Safari 브라우저 창을 식별하는 시스템을 구축했다. 'textarea' 같은 키워드가 포함된 창을 찾아 창 번호를 획득한 후 screencapture 명령어로 스크린샷을 촬영하는 방식이다.

더 놀라운 점은 버그 재현 과정이었다. Claude는 자체적으로 HTML 테스트 파일을 작성해 /tmp 폴더에 저장하고 Safari로 열었다. 모달 다이얼로그 테스트를 위해 Datasette 템플릿을 직접 수정해 JavaScript 코드를 삽입했다. 이 코드는 페이지 로딩 1.2초 후 자동으로 '/' 키보드 단축키를 시뮬레이션해 모달을 열도록 설계됐다.

또한 페이지 내 JavaScript 측정을 위해 CORS를 우회하는 커스텀 웹 애플리케이션을 개발하고 로컬 서버로 실행했다. 사용자가 브라우저 자동화나 고급 디버깅 도구 사용을 요청하지 않았음에도 Claude가 자발적으로 이런 복잡한 작업들을 수행한 것이다.

출처

simonwillison.net — 원문 읽기 →