Google lance Gemma 4 12B, modèle multimodal unifié

Original : Gemma 4 12B: A unified, encoder-free multimodal model

Pourquoi c'est important

Simplifie le développement d'applications IA multimodales avec architecture unifiée

Google présente Gemma 4 12B, un nouveau modèle d'IA multimodal de 12 milliards de paramètres sans encodeur séparé. Le modèle unifie le traitement de texte et d'images dans une architecture simplifiée pour les développeurs.

Google a annoncé le lancement de Gemma 4 12B, un modèle d'intelligence artificielle multimodal de 12 milliards de paramètres. Cette nouvelle version se distingue par son architecture 'encoder-free' qui élimine le besoin d'encodeurs séparés pour traiter différents types de données. Le modèle unifie le traitement du texte et des images dans une seule architecture, simplifiant le développement d'applications multimodales. Gemma 4 12B fait partie de la famille de modèles open source Gemma de Google, conçue pour offrir aux développeurs des outils d'IA performants et accessibles.

Source

blog.google — Lire l'original →