NVIDIA、26億パラメータのオープンソース世界モデル「SANA-WM」発表
原題: SANA-WM, a 2.6B open-source world model for 1-minute 720p video
なぜ重要か
効率的な世界モデル技術は自動運転やロボティクス分野での実用化を加速し、AI業界の次世代応用領域を開拓する重要技術となる
NVIDIAの研究部門が、720p解像度で1分間の動画生成が可能なオープンソース世界モデル「SANA-WM」を発表した。26億パラメータのモデルで、効率的な分単位スケールの世界モデリングを実現する。既存手法と比較して高い性能を示すとしている。
NVIDIA Labsは、26億パラメータのオープンソース世界モデル「SANA-WM」を公開した。このモデルは720p解像度で1分間の動画生成が可能で、効率的な分単位スケールの世界モデリングを実現している。世界モデルとは、環境の状態変化を予測し、将来のシナリオをシミュレーションできるAIシステムのことを指す。SANA-WMは比較的少ないパラメータ数でありながら、高品質な動画生成を可能にしている点が特徴である。研究チームは、従来の手法と比較して優れた性能を実現したと報告している。このモデルはオープンソースとして公開されており、研究者や開発者が自由に利用できる。世界モデルの技術は、ロボティクス、ゲーム開発、シミュレーション分野などでの応用が期待されている。NVIDIAは近年、生成AIと物理シミュレーション技術の融合に注力しており、今回の発表もその一環として位置づけられる。