Der Artikel stellt AddSR vor, ein neues Modell zur Blind-Super-Auflösung, das auf Stable Diffusion basiert. Im Gegensatz zu bisherigen SD-basierten Ansätzen verwendet AddSR nicht die niedrig-aufgelösten Eingabebilder, um die Ausgabe des Modells in jedem Inferenzschritt zu steuern. Stattdessen nutzt es die in einem vorherigen Schritt berechneten hochaufgelösten Bilder, um die Degradation der Eingabebilder abzumildern.
Darüber hinaus führt AddSR einen zeitschritt-adaptiven Verlust ein, um das Wahrnehmungs-Verzerrungsgleichgewicht zu verbessern, das durch den ursprünglichen ADD-Ansatz verursacht wurde. Außerdem wird eine bildqualitätsangepasste Strategie vorgeschlagen, um den Lehrer-Modell besser für die Ausbildung des Schüler-Modells zu nutzen.
Umfangreiche Experimente zeigen, dass AddSR in verschiedenen Degradationsszenarien und bei realen niedrigqualitativen Bildern überlegene Ergebnisse in 1-4 Schritten erzeugen kann und dabei deutlich schneller ist als bisherige SD-basierte Methoden.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Rui Xie,Ying... lúc arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01717.pdfYêu cầu sâu hơn