Modèles & API IA Apr 22 wired.com

OpenAI améliore le modèle de génération d'images de ChatGPT

Original : OpenAI Beefs Up ChatGPT’s Image Generation Model

Pourquoi c'est important

Amélioration majeure des capacités multimodales d'OpenAI face à la concurrence

OpenAI lance ChatGPT Images 2.0, un nouveau modèle capable de générer plusieurs images par requête et d'inclure du texte en langues non-anglaises comme le chinois et l'hindi. Disponible globalement avec une version premium pour les abonnés payants.

Le nouveau modèle ChatGPT Images 2.0 utilise les capacités de 'raisonnement' de ChatGPT pour rechercher des informations récentes sur internet et générer plusieurs images simultanément. Il possède une date de coupure des connaissances de décembre 2025. Les tests montrent des améliorations significatives dans le rendu de texte en anglais et la génération d'images plus détaillées. Le modèle permet des ratios d'aspect personnalisables de 3:1 large à 1:3 haut. Lors des tests, il a généré avec précision une infographie météo de San Francisco incluant des détails architecturaux corrects comme le Ferry Building et la Transamerica Pyramid. Cependant, il présente encore des difficultés avec les langues autres que l'anglais.

Source

wired.com — Lire l'original →

OpenAI améliore le modèle de génération d'images de ChatGPT

Pourquoi c'est important

Source

Articles connexes

Connectez-vous pour écouter