지난 6개월간 LLM 발전사항 5분 요약
원제: The last six months in LLMs in five minutes
왜 중요한가
LLM 기술이 실용적 수준에 도달하며 코딩 에이전트가 일상 도구로 활용 가능해졌음을 보여준다
Simon Willison이 PyCon US 2026에서 발표한 LLM 발전사항 요약에 따르면, 2025년 11월이 중요한 전환점이었다. 'GPT-5.1', 'Claude Opus 4.5', 'Gemini 3' 등 주요 모델들이 연이어 출시되며 선두가 5차례 바뀌었다.
Simon Willison은 PyCon US 2026에서 지난 6개월간의 LLM 발전사항을 5분 만에 요약하여 발표했다. 2025년 11월을 'LLM 변곡점'으로 규정하며, 특히 코딩 분야에서 중요한 변화가 있었다고 설명했다. 11월 동안 '최고'로 여겨지는 모델이 Claude Sonnet 4.5에서 시작해 GPT-5.1, Gemini 3, GPT-5.1 Codex Max, Claude Opus 4.5 순으로 5번 바뀌었다. Willison은 모델 비교를 위해 '자전거를 타는 펠리컨 그리기' 테스트를 사용했다고 밝혔다. 11월의 진정한 혁신은 코딩 에이전트의 품질 향상이었다. OpenAI와 Anthropic이 2025년 내내 진행한 Reinforcement Learning from Verifiable Rewards 연구 결과로, 코딩 에이전트가 '가끔 작동'에서 '대부분 작동' 수준으로 발전했다. 12월부터 1월 휴가 기간 동안 많은 개발자들이 새로운 모델을 실험했으며, Willison 자신도 Python으로 구현한 JavaScript인 'micro-javascript' 같은 프로젝트를 진행했다. 11월 말 시작된 'Warelay' 프로젝트는 2월에 'OpenClaw'로 이름을 바꾸며 개인 AI 어시스턴트 플랫폼으로 주목받기 시작했다.