Core Concepts
Durch den Vergleich des ursprünglichen und des Zielpromotions können zahlreiche Bearbeitungspaare erhalten werden, die jeweils ein Objekt und sein entsprechendes Bearbeitungsziel umfassen. Um Bearbeitbarkeit bei gleichzeitiger Treue zum Eingangsbild zu ermöglichen, verwenden bestehende Bearbeitungsmethoden in der Regel eine feste Anzahl von Umkehrungsschritten, die das gesamte Eingangsbild in seine rauschärmere Latenzdarstellung projizieren, gefolgt von einem Entlärmungsprozess, der durch den Zielpromotion gesteuert wird. Wir stellen jedoch fest, dass die optimale Anzahl der Umkehrungsschritte für das Erreichen idealer Bearbeitungsergebnisse aufgrund unterschiedlicher Bearbeitungsschwierigkeiten erheblich zwischen den verschiedenen Bearbeitungspaaren variiert. Daher produziert die derzeitige Literatur, die auf einer festen Anzahl von Umkehrungsschritten basiert, suboptimale Generierungsqualität, insbesondere bei der Bearbeitung mehrerer Bearbeitungspaare in einem natürlichen Bild. Um dies zu lösen, schlagen wir ein neues Bildbearbeitungsparadigma vor, das als objektbewusste Umkehrung und Neuzusammensetzung (OIR) bezeichnet wird, um eine objektbasierte, feingranulare Bearbeitung zu ermöglichen.
Abstract
Die Studie untersucht die Bildbearbeitung mit Diffusionsmodellen, bei der das Eingangsbild in seine rauschärmere Latenzdarstellung umgekehrt und dann unter Anleitung des Zielpromotions entlärmt wird, um das gewünschte Bearbeitungsergebnis zu erzielen.
Die Autoren stellen fest, dass die optimale Anzahl der Umkehrungsschritte für jedes Bearbeitungspaar unterschiedlich ist, da die Bearbeitungsschwierigkeiten variieren. Bestehende Methoden, die eine feste Anzahl von Umkehrungsschritten verwenden, führen daher zu suboptimalen Ergebnissen, insbesondere bei der Bearbeitung mehrerer Objekte in einem Bild.
Um dies zu lösen, schlagen die Autoren ein neues Paradigma namens "Objektbewusste Umkehrung und Neuzusammensetzung" (OIR) vor. Zunächst verwenden sie eine Suchmetrik, um die optimale Anzahl der Umkehrungsschritte für jedes Bearbeitungspaar automatisch zu bestimmen. Anschließend bearbeiten sie die einzelnen Bearbeitungspaare separat, um Konzeptfehlanpassungen zu vermeiden, und fügen die Ergebnisse dann mit Hilfe eines zusätzlichen Neuzusammensetzungsschritts wieder zusammen.
Die Autoren haben zwei neue Datensätze für die Evaluierung erstellt und zeigen, dass ihr Ansatz im Vergleich zu bestehenden Methoden sowohl in Einzel- als auch in Mehrfachobjektszenarien deutlich bessere Ergebnisse erzielt.
Stats
Die optimale Anzahl der Umkehrungsschritte für das Bearbeitungspaar (Papagei, gehäkelter Papagei) beträgt 35.
Die optimale Anzahl der Umkehrungsschritte für das Bearbeitungspaar (Ast, goldener Ast) beträgt 25.
Quotes
"Durch den Vergleich des ursprünglichen und des Zielpromotions können zahlreiche Bearbeitungspaare erhalten werden, die jeweils ein Objekt und sein entsprechendes Bearbeitungsziel umfassen."
"Wir stellen jedoch fest, dass die optimale Anzahl der Umkehrungsschritte für das Erreichen idealer Bearbeitungsergebnisse aufgrund unterschiedlicher Bearbeitungsschwierigkeiten erheblich zwischen den verschiedenen Bearbeitungspaaren variiert."