المفاهيم الأساسية
MotionAura는 고품질의 시간적 일관성을 가진 비디오를 생성하기 위해 새로운 3D VAE 아키텍처와 스펙트럼 변환기를 활용한 텍스트-비디오 생성 모델입니다.
Susladkar, O., Gupta, J. S., Sehgal, C., Mittal, S., & Singhal, R. (2024). MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion. arXiv preprint arXiv:2410.07659.
본 연구는 텍스트 프롬프트를 기반으로 시간적으로 일관되고 사실적인 고품질 비디오를 생성하는 것을 목표로 합니다.