本論文は、参照フレームを用いたラインアート動画の着色のための初めての動画ディフュージョンフレームワークを提案している。従来の手法は単一のフレームごとの着色に依存していたが、本手法は大規模に事前学習された動画ディフュージョンモデルを活用することで、より時間的に一貫性のある結果を生成できる。
具体的には以下の3つの貢献がある:
実験の結果、提案手法は従来手法と比べて、フレームクオリティ、動画クオリティ、時間的一貫性の全ての指標で大幅に優れていることが示された。また、ユーザースタディでも提案手法が最も好評を得た。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Zhitong Huan... kl. arxiv.org 09-20-2024
https://arxiv.org/pdf/2409.12960.pdfDybere Forespørgsler