本研究では、高品質で時間的に一貫性のある動画を生成するために、画像拡散モデルと動画拡散モデルを統合する新しい手法を提案している。
具体的には以下の3つの主要な貢献がある:
逆拡散プロセスの際に、画像拡散モデルと動画拡散モデルを組み合わせて使用する新しいサンプリング手法を提案した。これにより、画像の品質と動画の時間的一貫性を同時に高めることができる。
逆拡散プロセスの際のノイズ低減と時間的平滑化の手法を提案し、動画の品質をさらに向上させた。
事前学習済みのモデルを公開し、今後の研究の発展につなげる。
実験の結果、提案手法は定量的・定性的に優れた動画生成性能を示した。特に、時間的一貫性と画像品質のバランスが良く取れた高品質な動画を生成できることが確認された。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問