Der Artikel befasst sich mit dem Problem des nicht-rechteckigen Bildrahmens, der oft beim Stitching von Bildern auftritt. Die gängigen Lösungen wie Zuschneiden, Inpainting oder Verzerren weisen verschiedene Nachteile auf.
Um diese Probleme zu überwinden, wird ein neuartiger diffusionsbasierter Lernrahmen, RecDiffusion, vorgestellt. Dieser Ansatz kombiniert zwei Komponenten:
Bewegungsdiffusionsmodelle (MDM): Erzeugen Bewegungsfelder, um die unregelmäßigen Ränder des Stitching-Bildes in eine geometrisch korrigierte Form zu überführen.
Inhaltsdiffusionsmodelle (CDM): Verfeinern die Bilddetails, um visuelle Artefakte zu reduzieren, die durch die Ungenauigkeiten der Bewegungsfelder und Umwandlungsvorgänge entstehen können.
Zur Verbesserung der CDM-Leistung wird eine gewichtete Abtastmethode eingeführt, die auf dem Rang-Nullraum-Theorem basiert. Dadurch können die Vertrauensbereiche des Zwischenergebnisses erhalten und die Nicht-Vertrauensbereiche durch den CDM-Ausgang ersetzt werden.
Die umfangreichen Experimente zeigen, dass der RecDiffusion-Ansatz den bisherigen Methoden in quantitativen und qualitativen Vergleichen überlegen ist und einen neuen Stand der Technik etabliert.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы