SANA-WM : modèle de monde open-source 2,6B pour vidéo 720p

Original : SANA-WM, a 2.6B open-source world model for 1-minute 720p video

Pourquoi c'est important

Avancée majeure dans la génération vidéo longue durée open-source

Nvidia Labs présente SANA-WM, un modèle de monde open-source de 2,6 milliards de paramètres capable de générer des vidéos 720p d'une minute. Le modèle utilise une architecture efficace pour la modélisation du monde.

SANA-WM est un nouveau modèle de monde développé par Nvidia Labs avec 2,6 milliards de paramètres, conçu pour générer des vidéos haute résolution de longue durée. Le modèle peut produire des vidéos 720p d'une minute complète, représentant une avancée significative dans la génération vidéo par IA. L'approche utilise des techniques d'optimisation pour permettre une modélisation efficace du monde à grande échelle. Le projet est disponible en open-source, permettant à la communauté de recherche d'accéder à cette technologie avancée de génération vidéo.

Source

nvlabs.github.io — Lire l'original →