GLM-5.2, 오픈 소스 에이전트의 새로운 기준 제시

원제: GLM-5.2 is a step change for open agents

왜 중요한가

GLM-5.2의 성능 달성은 오픈 소스 모델이 상용 선도 모델과의 기술 격차를 좁히고 있음을 보여주며, AI 모델 시장의 경쟁 구도 변화를 의미한다.

중국 Z.ai가 6월 13일 공개한 GLM-5.2는 오픈 가중치 모델 중 처음으로 OpenAI, Anthropic의 최신 모델과 경쟁할 수 있는 수준에 도달했다. Arena 에이전트 리더보드에서 Opus 4.8과 동등한 성능을 보였으며, 커뮤니티 평가에서 광범위한 호평을 받고 있다.

Z.ai가 공개한 GLM-5.2는 업계에서 중요한 전환점으로 평가되고 있다. 6월 13일 토요일 GLM 코딩 플랜 회원을 대상으로 먼저 출시되었으며, 3일 뒤인 16일 MIT 라이선스 모델 가중치와 공식 블로그가 공개되었다.

성능 측면에서 GLM-5.2는 여러 벤치마크에서 뛰어난 결과를 나타냈다. Arena의 에이전트 리더보드에서 최대 사고 모드 설정 시 Anthropic의 Opus 4.8의 비사고 모드 성능과 동등한 수준을 기록했다. Design Arena 벤치마크에서도 최근 수출 규제로 금지된 Claude Fable을 능가했다는 평가를 받았다.

Z.ai는 SLIME이라는 강화학습 프레임워크를 활용했으며, 최대 사고 노력 설정으로 항상 사용할 것을 권장하고 있다. 업계 내 저명한 AI 연구자와 평론가들이 직접 사용 후 모델을 높이 평가했다.

GLM-5.2의 출시는 DeepSeek R1 출시 이후 오픈 소스 모델 분야에서 가장 주목할 만한 사건으로 꼽힌다. 이전 Kimi K2 출시가 중국의 오픈 모델 성능 향상 가능성을 시사했다면, GLM-5.2는 오픈 가중치 모델이 상용 최고 성능 모델과 직접 경쟁할 수 있음을 입증했다는 점에서 의미가 크다.

출처

interconnects.ai — 원문 읽기 →