구글, 멀티모달 AI 모델 Gemma 4 12B 공개
원제: Gemma 4 12B: A unified, encoder-free multimodal model
왜 중요한가
구글의 오픈소스 멀티모달 AI 모델 출시로 개발자 생태계 확장과 AI 접근성 향상 기대
구글이 통합 인코더 프리 멀티모달 AI 모델인 Gemma 4 12B를 공식 발표했다. 개발자들을 위한 새로운 도구로 설계된 이 모델은 텍스트, 이미지 등 다양한 형태의 데이터를 하나의 모델로 처리할 수 있는 기능을 제공한다.
구글이 새로운 오픈소스 AI 모델인 Gemma 4 12B를 공개했다고 발표했다. 이 모델은 기존의 인코더-디코더 구조에서 벗어나 인코더 없는 통합 아키텍처를 채택한 멀티모달 모델이다. Gemma 4 12B는 텍스트, 이미지, 동영상 등 다양한 형태의 입력을 단일 모델로 처리할 수 있도록 설계되었다. 이전 Gemma 시리즈와 달리 멀티모달 기능을 네이티브로 지원하여 개발자들이 더욱 유연하게 AI 애플리케이션을 구축할 수 있게 됐다. 특히 12억 파라미터 규모로 경량화와 성능을 동시에 추구한 점이 특징이다. 구글은 이 모델이 개발자 도구의 일환으로 제공되며, 다양한 멀티모달 작업에서 효율적인 성능을 보여줄 것이라고 설명했다. 해당 모델은 Hugging Face와 기타 플랫폼을 통해 개발자 커뮤니티에 공개될 예정이다.