Anthropic, Claude 코드 품질 저하 원인 3가지 공개
원제: An update on recent Claude Code quality reports
왜 중요한가
AI 모델 품질 관리와 사용자 피드백 대응 방식의 중요성을 보여주는 사례로, 향후 AI 서비스 개선 프로세스에 영향을 줄 것으로 예상
Anthropic이 지난 한 달간 제기된 Claude 응답 품질 저하 문제를 분석한 결과, Claude Code의 추론 강도 기본값 변경, 세션 메모리 버그, 시스템 프롬프트 수정 등 3가지 별개 원인이 있었다고 발표했다. 4월 20일까지 모든 문제를 해결했다.
Anthropic은 공식 블로그를 통해 최근 Claude Code 품질 저하 보고에 대한 분석 결과를 공개했다. 회사는 API와 추론 계층은 영향받지 않았으며, 모델을 의도적으로 저하시킨 적이 없다고 강조했다. 첫 번째 문제는 3월 4일 Claude Code의 기본 추론 강도를 'high'에서 'medium'으로 변경한 것이다. 이는 high 모드에서 UI가 멈춘 것처럼 보이는 긴 대기시간 문제를 해결하려 했지만, 사용자들이 단순한 작업에만 낮은 추론 강도를 선택하고 기본값은 높은 지능을 선호한다는 피드백에 따라 4월 7일 되돌렸다. 두 번째는 3월 26일 도입된 세션 메모리 관리 기능의 버그였다. 1시간 이상 유휴 상태인 세션의 이전 사고 과정을 지우도록 설계됐지만, 버그로 인해 매 턴마다 계속 발생해 Claude가 건망증적이고 반복적으로 보이게 했다. 이는 4월 10일 수정됐다. 세 번째는 4월 16일 추가된 장황함을 줄이는 시스템 프롬프트 지시사항이 다른 프롬프트 변경과 결합되어 코딩 품질을 저하시킨 것으로, 4월 20일 되돌렸다. 각 변경사항이 다른 일정과 트래픽 구간에 영향을 미쳐 전반적이고 일관되지 않은 성능 저하로 보였다고 설명했다.