核心概念
不同的 DiT 模型在擴散步驟中展現出不同的冗餘分佈,但單一模型的冗餘分佈不受輸入提示、步驟數或調度策略變化的影響。
摘要
擴散模型轉換器 (DiT) 中的冗餘:一項系統性研究
這篇研究論文探討了擴散模型轉換器 (DiT) 在圖像和影片生成過程中各擴散步驟中的冗餘現象。論文首先回顧了現有研究對 DiT 冗餘的理解,接著介紹了作者們的系統性研究方法。
擴散模型近年來在圖像和影片生成領域中取得了主導地位,而 DiT 模型則逐漸取代了傳統的 U-Net 架構。然而,隨著 DiT 模型參數和輸入序列長度的增加,其推理延遲也隨之增長,這對模型部署和應用,特別是即時服務,帶來了挑戰。
為了解決這個問題,許多研究致力於降低 DiT 模型的推理延遲。其中一個研究方向是利用 DiT 的轉換器骨幹,將現有的加速轉換器計算的方法(如剪枝、蒸餾、量化和並行化)重新調整用途。另一個研究方向則關注於利用擴散過程中相鄰步驟之間的激活值相似性(稱為冗餘)來減少計算開銷。
儘管現有一些研究分析了 DiT 模型中的冗餘現象,並提出了一些緩存機制來加速推理過程,但這些研究的結論並不一致,甚至存在相互矛盾的情況。這導致了為特定模型開發的方法難以推廣到其他模型,也阻礙了新方法的開發。