Der Artikel stellt AddSR vor, ein neues Modell zur Blind-Super-Auflösung, das auf Stable Diffusion basiert. Im Gegensatz zu bisherigen SD-basierten Ansätzen verwendet AddSR nicht die niedrig-aufgelösten Eingabebilder, um die Ausgabe des Modells in jedem Inferenzschritt zu steuern. Stattdessen nutzt es die in einem vorherigen Schritt berechneten hochaufgelösten Bilder, um die Degradation der Eingabebilder abzumildern.
Darüber hinaus führt AddSR einen zeitschritt-adaptiven Verlust ein, um das Wahrnehmungs-Verzerrungsgleichgewicht zu verbessern, das durch den ursprünglichen ADD-Ansatz verursacht wurde. Außerdem wird eine bildqualitätsangepasste Strategie vorgeschlagen, um den Lehrer-Modell besser für die Ausbildung des Schüler-Modells zu nutzen.
Umfangreiche Experimente zeigen, dass AddSR in verschiedenen Degradationsszenarien und bei realen niedrigqualitativen Bildern überlegene Ergebnisse in 1-4 Schritten erzeugen kann und dabei deutlich schneller ist als bisherige SD-basierte Methoden.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Rui Xie,Ying... às arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01717.pdfPerguntas Mais Profundas