本論文では、RealCraftというゼロショットのビデオ編集手法を提案しました。この手法は、注目制御方法を使用して、一貫した形状に焦点を当てた編集と時間的一貫性を向上させます。大規模なテキスト駆動拡散モデルに基づく最近の進歩により、高品質で多様な視覚コンテンツが生成されるようになりました。しかし、実世界の画像やビデオのセマンティック編集は、構造的一貫性の維持と局所化が追加の課題を提起します。本手法は、ゼロショットのビデオ編集において形状に焦点を当てた変更と時間的一貫性を強化することで、これらの課題に対処します。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Shutong Jin,... klokken arxiv.org 03-11-2024
https://arxiv.org/pdf/2312.12635.pdfDypere Spørsmål