我們提出了第一個基於視頻擴散模型的參考影像線稿視頻著色框架。與之前僅依賴於影像生成模型的方法不同,我們利用預訓練的大規模視頻擴散模型生成時間一致的動畫視頻。這種方法可以產生更好的時間一致性結果,並且能夠更好地處理大幅運動。