核心概念
現有的分數蒸餾方法對分類器自由引導(CFG)尺度敏感,表現為在小CFG尺度下過度平滑或不穩定,而在大尺度下過度飽和。為了解釋和分析這些問題,我們重新審視了分數蒸餾採樣(SDS)的推導,並用瓦瑟斯坦生成對抗網絡(WGAN)範式解碼現有的分數蒸餾。在WGAN範式下,我們發現現有的分數蒸餾要么使用固定的次優判別器,要么進行不完整的判別器優化,導致了尺度敏感的問題。我們提出了對抗性分數蒸餾(ASD),它保持可優化的判別器,並使用完整的優化目標更新它。實驗表明,所提出的ASD在2D蒸餾和文本到3D任務中的表現優於現有方法。此外,為了探索我們範式的泛化能力,我們將ASD擴展到圖像編輯任務,並取得了競爭性的結果。
要約
本文提出了對抗性分數蒸餾(ASD)方法,以解決現有分數蒸餾方法對分類器自由引導(CFG)尺度敏感的問題。
-
現有的分數蒸餾方法,如分數蒸餾採樣(SDS)和變分分數蒸餾(VSD),在小CFG尺度下容易出現過度平滑或不穩定的問題,而在大尺度下則容易過度飽和。
-
作者通過重新審視SDS的推導,發現SDS的梯度實際上來自於生成對抗網絡(GAN)的生成器損失,而不是擴散模型的L2損失。這意味著SDS隱含地使用了一個固定的次優判別器。
-
作者進一步分析VSD,發現它也可以用WGAN範式表示,但其判別器優化目標是不完整的,導致了蒸餾過程的不穩定。
-
基於WGAN範式,作者提出了ASD方法,它保持一個可優化的判別器,並使用完整的WGAN判別器損失進行優化。這樣可以提高蒸餾的穩定性和質量。
-
實驗表明,ASD在2D蒸餾、文本到3D和圖像編輯任務中都表現優於現有方法。此外,將分數蒸餾與GAN聯繫起來,可以使強大的擴散模型以分數蒸餾的形式應用於各種下游任務。
統計
現有的分數蒸餾方法對分類器自由引導(CFG)尺度敏感,在小尺度下容易出現過度平滑,在大尺度下容易過度飽和。
分數蒸餾採樣(SDS)的梯度實際上來自於生成對抗網絡(GAN)的生成器損失,而不是擴散模型的L2損失。
變分分數蒸餾(VSD)的判別器優化目標是不完整的,導致了蒸餾過程的不穩定。
引用
"現有的分數蒸餾方法對分類器自由引導(CFG)尺度敏感,表現為在小CFG尺度下過度平滑或不穩定,而在大尺度下過度飽和。"
"SDS的梯度實際上來自於生成對抗網絡(GAN)的生成器損失,而不是擴散模型的L2損失。"
"VSD的判別器優化目標是不完整的,導致了蒸餾過程的不穩定。"