本文探討了通過資料篩選來提高擴散模型(DM)的訓練效率的問題。首先,作者使用了一種基於GAN的資料選擇方法,包括特徵嵌入和數據評分。然而,作者發現這種資料選擇方法在小型數據集上對DM的泛化性能有限。為了解決這個問題,作者提出了一種基於類別重加權的策略,通過分佈魯棒優化(DRO)來優化類別權重,以提高生成性能。
實驗結果表明,在CIFAR-10、ImageNet和ImageNette數據集上,作者的方法可以在保持或提高生成性能的同時,將DM的訓練速度提高2.34倍到8.32倍。對於像素級別的DDPM和潛在級別的MDT和Stable Diffusion,作者的方法都取得了顯著的效果。此外,作者還發現在大型數據集上微調LDM時,使用較小的子集就能獲得更好的生成性能,突出了大型訓練數據集中存在冗餘的可能性。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor