本文提出了對抗性分數蒸餾(ASD)方法,以解決現有分數蒸餾方法對分類器自由引導(CFG)尺度敏感的問題。
現有的分數蒸餾方法,如分數蒸餾採樣(SDS)和變分分數蒸餾(VSD),在小CFG尺度下容易出現過度平滑或不穩定的問題,而在大尺度下則容易過度飽和。
作者通過重新審視SDS的推導,發現SDS的梯度實際上來自於生成對抗網絡(GAN)的生成器損失,而不是擴散模型的L2損失。這意味著SDS隱含地使用了一個固定的次優判別器。
作者進一步分析VSD,發現它也可以用WGAN範式表示,但其判別器優化目標是不完整的,導致了蒸餾過程的不穩定。
基於WGAN範式,作者提出了ASD方法,它保持一個可優化的判別器,並使用完整的WGAN判別器損失進行優化。這樣可以提高蒸餾的穩定性和質量。
實驗表明,ASD在2D蒸餾、文本到3D和圖像編輯任務中都表現優於現有方法。此外,將分數蒸餾與GAN聯繫起來,可以使強大的擴散模型以分數蒸餾的形式應用於各種下游任務。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Min Wei, Jin... lúc arxiv.org 09-11-2024
https://arxiv.org/pdf/2312.00739.pdfYêu cầu sâu hơn