本文提出了FINE方法,旨在解決擴散模型訓練效率低下的問題。FINE通過分解預訓練模型的知識,提取出尺寸無關的學習基因(learngenes),這些學習基因可以用於有效地初始化不同尺寸的擴散模型,同時也能適應不同任務的需求。
具體來說,FINE將預訓練模型的權重矩陣分解為共享的奇異向量U和V,以及特定層的奇異值Σ。U和V代表了尺寸無關的知識,即學習基因,可以跨層共享。而Σ則包含了特定層的參數。在初始化時,FINE固定U和V,只需優化少量的Σ參數,即可適應不同尺寸的模型和任務需求。
實驗結果表明,FINE在ImageNet-1K數據集上的擴散模型初始化效果顯著優於其他方法,在10K步訓練後就能達到比直接預訓練30K步更好的性能。此外,FINE在不同下游任務上也表現出色,如CelebA、LSUN-Bedroom和LSUN-Church,展現了良好的適應性和通用性。
總的來說,FINE提出了一種有效的擴散模型初始化方法,通過知識分解提取尺寸無關的學習基因,實現了對模型尺寸和任務需求的靈活適應,大幅提升了模型的訓練效率和性能。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yucheng Xie,... في arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19289.pdfاستفسارات أعمق