本論文提出了一種針對預訓練擴散模型進行快速約束採樣的新演算法,旨在解決現有方法在速度和品質方面的不足。作者認為,基於預訓練模型的圖像條件生成應更多地依賴於圖像像素之間的低級相關性,而非圖像與文字之間難以學習的語義知識。
現有的基於預訓練擴散模型的圖像生成方法主要依賴於微調或修改採樣過程,但這些方法存在計算成本高、速度慢等問題。
作者提出了一種基於優化視角的新方法,通過數值逼近昂貴的梯度來加速優化過程。具體而言,該方法利用反函數的一階泰勒展開來逼近目標移動方向,並通過兩次前向傳播來計算梯度,避免了反向傳播的計算成本。
作者在 ImageNet 數據集上進行了圖像修復和超分辨率實驗,結果表明,該方法在保證生成圖像品質的同時,顯著縮短了推理時間。
本文提出的快速約束採樣演算法為預訓練擴散模型的應用開闢了新的可能性,使其能夠在更廣泛的圖像生成任務中發揮作用。
翻譯成其他語言
從原文內容
arxiv.org
深入探究