OpenAI améliore le modèle de génération d'images de ChatGPT
Original : OpenAI Beefs Up ChatGPT’s Image Generation Model
Pourquoi c'est important
Amélioration majeure des capacités multimodales d'OpenAI face à la concurrence
OpenAI lance ChatGPT Images 2.0, un nouveau modèle capable de générer plusieurs images par requête et d'inclure du texte en langues non-anglaises comme le chinois et l'hindi. Disponible globalement avec une version premium pour les abonnés payants.
Le nouveau modèle ChatGPT Images 2.0 utilise les capacités de 'raisonnement' de ChatGPT pour rechercher des informations récentes sur internet et générer plusieurs images simultanément. Il possède une date de coupure des connaissances de décembre 2025. Les tests montrent des améliorations significatives dans le rendu de texte en anglais et la génération d'images plus détaillées. Le modèle permet des ratios d'aspect personnalisables de 3:1 large à 1:3 haut. Lors des tests, il a généré avec précision une infographie météo de San Francisco incluant des détails architecturaux corrects comme le Ferry Building et la Transamerica Pyramid. Cependant, il présente encore des difficultés avec les langues autres que l'anglais.