구글, 모바일·노트북용 Gemma 4 QAT 모델 출시
원제: Gemma 4 QAT models: Optimizing compression for mobile and laptop efficiency
왜 중요한가
모바일·엣지 AI 시장 확산을 위한 핵심 기술로 온디바이스 AI 생태계 발전에 기여할 전망
구글이 양자화 인식 훈련(QAT)을 적용한 Gemma 4 모델을 공개했다. 이 모델은 모바일과 노트북 환경에서 효율적인 실행을 위해 모델 압축을 최적화했으며, 성능 저하 없이 더 작은 크기로 구동할 수 있도록 설계되었다.
구글이 개발자들을 위해 양자화 인식 훈련(Quantization-Aware Training, QAT)을 적용한 Gemma 4 모델을 발표했다. 이번 모델은 모바일 기기와 노트북에서의 효율적인 실행을 목표로 한다. QAT 기술은 모델 훈련 과정에서 양자화 효과를 미리 고려하여, 실제 배포 시 성능 저하를 최소화하면서도 모델 크기를 대폭 줄일 수 있게 한다. 이를 통해 제한된 컴퓨팅 자원을 가진 엣지 디바이스에서도 고성능 AI 모델을 구동할 수 있다. Gemma 4 QAT 모델은 기존 Gemma 모델 대비 메모리 사용량과 연산량을 크게 줄이면서도 정확도는 유지한다. 구글은 이 모델이 모바일 앱 개발자들과 엣지 AI 솔루션을 구축하는 개발자들에게 특히 유용할 것이라고 설명했다.