Der Artikel befasst sich mit der Verbesserung von Diffusions-Inverse-Solvern (DIS) durch den Einsatz von Konsistenzmodellen (CM).
Zunächst wird gezeigt, dass für lineare Operatoren f(.) der Abstand mit dem Posterior-Mittelwert genauso gut ist wie mit einer einzelnen Posterior-Stichprobe und daher vorzuziehen ist, da er deterministisch ist und keine Monte-Carlo-Simulation erfordert. Für nicht-lineare Operatoren f(.) ist hingegen der Abstand mit der Posterior-Stichprobe besser.
Da bisherige Approximationen der Posterior-Stichprobe nicht wie echte Bilder aussehen, schlagen die Autoren vor, stattdessen CM als hochwertige Approximation zu verwenden. Darüber hinaus präsentieren sie eine neue Familie von DIS, die reine CM-Invertierung verwendet, inspiriert von GAN-Invertierung.
Die empirischen Ergebnisse zeigen, dass der Ersatz des Posterior-Mittelwerts durch CM die DIS-Leistung bei nicht-linearen Operatoren wie semantischer Segmentierung und Bildunterschrift verbessert. Darüber hinaus funktioniert die reine CM-Invertierung gut sowohl für lineare als auch für nicht-lineare Operatoren.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询