NVIDIA, 1분 길이 720p 영상 생성하는 26억 파라미터 오픈소스 월드모델 SANA-WM 공개

원제: SANA-WM, a 2.6B open-source world model for 1-minute 720p video

왜 중요한가

오픈소스 월드모델로 AI 영상생성 기술 민주화와 로보틱스·자율주행 분야 연구 발전을 촉진할 전망

NVIDIA가 1분 길이의 720p 해상도 비디오를 생성할 수 있는 26억 파라미터 규모의 오픈소스 월드모델 'SANA-WM'을 공개했다. 이 모델은 효율적인 분 단위 월드 모델링을 지원하며 연구 목적으로 활용할 수 있다.

NVIDIA Labs가 개발한 SANA-WM은 26억(2.6B) 파라미터를 가진 오픈소스 월드모델로, 1분 길이의 720p 해상도 비디오를 생성할 수 있는 능력을 보유하고 있다. 이 모델은 '효율적인 분 단위 월드 모델링(Efficient Minute-Scale World Modeling)'을 목표로 설계되었으며, 기존 월드모델들과 비교해 상당히 긴 시간의 영상을 생성할 수 있다는 점이 특징이다. SANA-WM은 연구 커뮤니티가 자유롭게 활용할 수 있도록 오픈소스로 공개되었으며, 월드모델 기술 발전에 기여할 것으로 기대된다. 월드모델은 AI가 환경을 이해하고 예측하는 능력을 향상시키는 핵심 기술로, 특히 로보틱스, 자율주행, 시뮬레이션 등 다양한 분야에서 활용 가능하다. NVIDIA의 이번 공개는 AI 영상 생성 기술의 접근성을 높이고 관련 연구를 가속화할 것으로 전망된다.

출처

nvlabs.github.io — 원문 읽기 →