In dieser Arbeit wird GoodDrag, ein neuartiger Ansatz zur Verbesserung der Stabilität und Bildqualität beim Drag-Editing, vorgestellt.
Der erste Beitrag ist das Alternating-Drag-and-Denoising (AlDD)-Framework, das den Drag- und Denoising-Prozess innerhalb des Diffusionsprozesses abwechselt. Im Gegensatz zu bestehenden Methoden, die alle Drag-Operationen auf einmal durchführen und dann versuchen, die kumulierten Störungen zu korrigieren, verhindert AlDD die Akkumulation großer Störungen und ermöglicht so ein genaueres Editing-Ergebnis.
Der zweite Beitrag ist die Untersuchung von Artefakten in den bearbeiteten Ergebnissen und dem häufigen Versagen der Punktsteuerung, bei dem der Startpunkt nicht genau an den gewünschten Endpunkt gezogen werden kann. Um dieses Problem zu lösen, wird eine informationserhaltende Bewegungsüberwachung vorgeschlagen, die die ursprünglichen Merkmale des Startpunkts beibehält und so realistische und präzise Punktmanipulationen ermöglicht.
Darüber hinaus wird ein neuer Datensatz namens Drag100 und zwei spezielle Qualitätsbewertungsmetriken, DAI und GScore, eingeführt, um den Fortschritt beim Drag-Editing zu messen. Umfangreiche Experimente zeigen, dass das vorgeschlagene GoodDrag sowohl qualitativ als auch quantitativ besser abschneidet als der Stand der Technik.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Zewei Zhang,... om arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.07206.pdfDiepere vragen