核心概念
擴散模型中的後驗平均預測器(PMP)在一定噪聲範圍內具有局部線性特性,其雅可比矩陣的奇異向量位於低維子空間。利用這些特性,我們提出了一種無監督、單步、無需額外訓練的低秩可控圖像編輯(LOCO Edit)方法,能夠實現精確的局部編輯,並具有良好的線性性、可轉移性和可組合性等特點。
要約
本文探索了擴散模型中後驗平均預測器(PMP)的兩個有趣特性:
- 在一定噪聲範圍內,PMP是局部線性的。
- PMP的雅可比矩陣具有低秩性質,其奇異向量位於低維子空間。
基於這些發現,作者提出了一種低秩可控圖像編輯(LOCO Edit)方法:
- 利用PMP的局部線性特性,可以通過沿著雅可比矩陣的奇異向量進行線性編輯,實現單步、無監督的編輯。
- 利用雅可比矩陣的低秩性質,可以通過零空間投影實現精確的局部編輯,並保持其他區域的一致性。
- 所識別的編輯方向具有良好的線性性、可轉移性和可組合性。
作者還將LOCO Edit方法推廣到了文本引導的擴散模型(T-LOCO Edit),實現了有監督和無監督的文本引導編輯。
實驗結果表明,LOCO Edit在精確局部編輯、編輯方向的良好特性以及計算效率等方面都優於現有方法。作者還提供了理論分析,證明了PMP的局部線性和低秩性質。
統計
在一定噪聲範圍內,PMP的雅可比矩陣的秩佔總維度的比例低於10%。
即使在大的編輯步長下,PMP的輸出仍然與其線性近似非常接近。