본 연구는 콘텐츠 프레임과 저차원 모션 잠재 표현으로 구성된 효율적인 비디오 확산 모델을 제안한다. 이를 통해 사전 학습된 이미지 확산 모델을 활용하여 비디오 생성 품질을 높이고 계산 및 메모리 효율성을 크게 향상시킬 수 있다.