PR 스팸, 2000년대 이메일 스팸과 닮아
원제: PR spam today looks like email spam in the early 2000s
왜 중요한가
오픈소스 생태계의 PR 스팸 현상은 기여자 평판 시스템과 AI 모델의 다양성 강화 필요성을 시사하며, 향후 코드 리뷰 자동화 솔루션의 중요성을 증대시킨다.
Greptile이 GitHub의 급성장 저장소 OpenClaw의 PR 데이터를 분석한 결과, 12월 주 2건에서 2월 주 3,400건으로 급증했다. 병합률은 48%에서 9.3%로 하락했으며, AI 코딩 에이전트가 생성한 저품질 PR이 대량 유입되고 있다.
Greptile의 Rahul Bathija는 OpenClaw 저장소의 풀 리퀘스트(PR) 통계를 분석해 현황을 공개했다. 지난해 12월에는 주당 약 2건의 PR이 제출됐으나, 2월에는 주당 3,400건으로 1,700배 이상 급증했다. 동시에 병합률은 48%에서 9.3%로 급락했다.
한 기여자는 하루에 106개의 PR을 제출했으며, 제출 간격의 중앙값은 3초 수준이었다. 이러한 대량의 PR 중 상당수는 AI 코딩 에이전트가 자동 생성한 '저품질 슬롭(slop)'으로 파악됐다.
Bathija는 현재 상황을 2000년대 초반 이메일 스팸 사태에 비유했다. 당시 ILOVEYOU 웜이 24시간 내 4,500만 대의 컴퓨터를 감염시킨 이유는 이메일 전송 비용이 거의 없었기 때문이었다. 마찬가지로 PR 제출 비용도 급격히 낮아져 대량의 저품질 PR이 유입되고 있다는 설명이다.
OpenClaw 데이터에 따르면 첫 기여자의 병합률은 8.2%, 2~5개 PR을 제출한 기여자는 10.3%, 5개 이상은 18.6%로, 기여자 평판에 따라 병합률이 크게 달라진다. Ghostty 유지보수자 Mitchell Hashimoto는 AI 생성 PR 스팸 대응으로 'Vouch'라는 신뢰 관리 시스템을 개발했다. 이는 기여자 평판 인프라의 필요성을 보여준다.
OpenClaw에서 10명 이상이 동일한 기능을 추가하려 시도했으며, 4명이 정확히 같은 제목의 PR을 제출했다. 이는 AI 모델들이 유사한 해결책으로 수렴하면서 다양성이 감소하는 문제를 드러낸다.