Der Artikel befasst sich mit der Verbesserung von Diffusions-Inverse-Solvern (DIS) durch den Einsatz von Konsistenzmodellen (CM).
Zunächst wird gezeigt, dass für lineare Operatoren f(.) der Abstand mit dem Posterior-Mittelwert genauso gut ist wie mit einer einzelnen Posterior-Stichprobe und daher vorzuziehen ist, da er deterministisch ist und keine Monte-Carlo-Simulation erfordert. Für nicht-lineare Operatoren f(.) ist hingegen der Abstand mit der Posterior-Stichprobe besser.
Da bisherige Approximationen der Posterior-Stichprobe nicht wie echte Bilder aussehen, schlagen die Autoren vor, stattdessen CM als hochwertige Approximation zu verwenden. Darüber hinaus präsentieren sie eine neue Familie von DIS, die reine CM-Invertierung verwendet, inspiriert von GAN-Invertierung.
Die empirischen Ergebnisse zeigen, dass der Ersatz des Posterior-Mittelwerts durch CM die DIS-Leistung bei nicht-linearen Operatoren wie semantischer Segmentierung und Bildunterschrift verbessert. Darüber hinaus funktioniert die reine CM-Invertierung gut sowohl für lineare als auch für nicht-lineare Operatoren.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Tongda Xu,Zi... at arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12063.pdfDeeper Inquiries