事前学習済みの拡散モデルに基づいて、入力情報の固有の特徴を抽出し、フレーム間の一貫性を高めるための新しいアーキテクチャを提案する。
拡散モデルは、画像生成や編集だけでなく、ビデオ生成の分野でも優れた性能を発揮しており、近年急速に注目を集めている。本論文は、ビデオ生成に関する拡散モデルの最新の研究動向を包括的に整理し、課題と今後の発展方向を明らかにする。