비디오 확산 모델을 활용하여 대규모 합성 다중 뷰 데이터셋을 생성하고, 이를 통해 단일 이미지에서 고품질 3D 자산을 생성할 수 있는 모델을 학습하였다.
단일 이미지에서 고품질이고 다각도 일관성 있는 3D 자산을 생성하기 위해 확산 시간 단계 커리큘럼을 활용한다.