Krea 2 : modèle d'image open-weights 12B à l'état de l'art
Original : Krea 2: SOTA open-weights 12B image model
Pourquoi c'est important
Modèle open-weights majeur apportant contrôle créatif et diversité esthétique à la génération d'images, répondant aux limitations des systèmes existants.
Krea présente Krea 2, une série de modèles de fondation pour la génération d'images conçus pour l'exploration créative. Le modèle 12B open-weights utilise une architecture diffusion transformer avec une formation multi-étapes et une infrastructure distribuée personnalisée pour offrir diversité esthétique et contrôle créatif aux utilisateurs.
Krea a annoncé le lancement de Krea 2, une série de modèles de fondation destinés à l'exploration créative en génération d'images. Contrairement aux systèmes existants optimisés pour la fiabilité mais convergant vers des esthétiques par défaut étroites, Krea 2 vise à être expressif et contrôlable pour les créateurs. Le modèle emploie une architecture diffusion transformer (DiT) développée par ablations approfondies. L'infrastructure comprend une curation de données à grande échelle pour couvrir une connaissance générale large et une couverture de style diversifiée. Le pipeline de formation multi-étapes inclut la préformation, la midtraining, l'ajustement supervisé, l'optimisation des préférences et l'apprentissage par renforcement. Des améliorations architecturales sont intégrées, notamment l'attention à requête groupée (GQA), l'attention sigmoïde-gated, la modulation de pas de temps légère et l'agrégation de caractéristiques multi-couches. Les poids du modèle et l'inférence sont publiés sous une licence permissive sur Hugging Face et GitHub. L'équipe a également créé une infrastructure distribuée personnalisée pour entraîner un modèle capable de générer des images haute résolution avec photorréalisme stable et densité textuelle, tout en restant explorable pour diverses esthétiques et styles visuels.