Der Artikel befasst sich mit der Verbesserung von Diffusions-Inverse-Solvern (DIS) durch den Einsatz von Konsistenzmodellen (CM).
Zunächst wird gezeigt, dass für lineare Operatoren f(.) der Abstand mit dem Posterior-Mittelwert genauso gut ist wie mit einer einzelnen Posterior-Stichprobe, und daher vorzuziehen ist, da er deterministisch ist und keine Monte-Carlo-Simulation erfordert. Für nicht-lineare Operatoren f(.) ist jedoch der Abstand mit der Posterior-Stichprobe besser.
Da frühere Approximationen der Posterior-Stichprobe nicht wie ein echtes Bild aussehen, schlagen die Autoren vor, CM als hochwertige Approximation zu verwenden. Darüber hinaus führen sie eine neue Familie von DIS ein, die reine CM-Invertierung verwendet.
Empirisch zeigen die Autoren, dass der Ersatz des Posterior-Mittelwerts durch CM die DIS-Leistung bei nicht-linearen Operatoren (z.B. semantische Segmentierung, Bildunterschriften) verbessert. Darüber hinaus funktioniert ihre reine CM-Invertierung gut für sowohl lineare als auch nicht-lineare Operatoren.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문