AI モデル・API 6月3日 blog.google

Googleが統合マルチモーダルモデル「Gemma 4 12B」を発表

原題: Gemma 4 12B: A unified, encoder-free multimodal model

なぜ重要か

エンコーダーフリーの新アーキテクチャにより効率的なマルチモーダル処理が可能となり、AI開発の新たな方向性を示す。

Googleは2026年6月3日、新しいAIモデル「Gemma 4 12B」を発表した。このモデルは統合されたエンコーダーフリーのマルチモーダルモデルとして設計されており、テキスト、画像、音声などの複数の入力形式に対応する。開発者向けツールとして提供される予定。

Googleは公式ブログで新しいAIモデル「Gemma 4 12B」を発表した。このモデルは「統合されたエンコーダーフリーマルチモーダルモデル」として位置づけられており、従来のエンコーダーを使用しない新しいアーキテクチャを採用している。

Gemma 4 12Bは12億パラメータを持つモデルで、テキスト、画像、音声など複数のデータ形式を統合的に処理できる能力を備えている。エンコーダーフリーの設計により、より効率的な処理が可能となり、開発者にとって使いやすいツールとなることが期待されている。

このモデルはGoogleのAI研究開発の一環として開発され、同社のGeminiモデルシリーズの技術を基盤としている。開発者向けツールとして提供される予定で、様々なアプリケーション開発に活用できる。Googleは引き続きAI技術の民主化と開発者コミュニティへの貢献を目指している。