Der Artikel stellt AddSR vor, ein neues Modell zur Blind-Super-Auflösung, das auf Stable Diffusion basiert. Im Gegensatz zu bisherigen SD-basierten Ansätzen verwendet AddSR nicht die niedrig-aufgelösten Eingabebilder, um die Ausgabe des Modells in jedem Inferenzschritt zu steuern. Stattdessen nutzt es die in einem vorherigen Schritt berechneten hochaufgelösten Bilder, um die Degradation der Eingabebilder abzumildern.
Darüber hinaus führt AddSR einen zeitschritt-adaptiven Verlust ein, um das Wahrnehmungs-Verzerrungsgleichgewicht zu verbessern, das durch den ursprünglichen ADD-Ansatz verursacht wurde. Außerdem wird eine bildqualitätsangepasste Strategie vorgeschlagen, um den Lehrer-Modell besser für die Ausbildung des Schüler-Modells zu nutzen.
Umfangreiche Experimente zeigen, dass AddSR in verschiedenen Degradationsszenarien und bei realen niedrigqualitativen Bildern überlegene Ergebnisse in 1-4 Schritten erzeugen kann und dabei deutlich schneller ist als bisherige SD-basierte Methoden.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Rui Xie,Ying... alle arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01717.pdfDomande più approfondite