Google lance Gemma 4 QAT pour optimiser l'IA mobile

Original : Gemma 4 QAT models: Optimizing compression for mobile and laptop efficiency

Pourquoi c'est important

Démocratise l'IA en permettant son déploiement sur appareils mobiles

Google présente les modèles Gemma 4 QAT utilisant l'entraînement avec quantification pour améliorer l'efficacité de compression sur mobiles et ordinateurs portables, réduisant la taille des modèles.

Google a annoncé le lancement des modèles Gemma 4 QAT (Quantization-Aware Training) conçus pour optimiser la compression des modèles d'IA destinés aux appareils mobiles et ordinateurs portables. Cette technologie d'entraînement avec quantification permet de réduire significativement la taille des modèles tout en maintenant leurs performances. Les modèles QAT sont spécifiquement développés pour fonctionner efficacement sur des dispositifs aux ressources limitées, permettant le déploiement d'IA avancée sur smartphones et laptops sans compromettre la vitesse d'exécution.

Source

blog.google — Lire l'original →