Der Artikel untersucht effiziente asymmetrische Blindstellen für selbstüberwachtes Entfernen von Rauschen in Echtzeit-Szenarien.
Bisherige Methoden haben versucht, die räumliche Korrelation des Rauschens durch Downsampling oder Nachbarschaftsmasking zu unterbrechen. Downsampling-basierte Methoden führen jedoch zu Aliasing-Effekten und Detailverlusten aufgrund einer geringeren Abtastrate. Nachbarschaftsmasking-Methoden haben entweder eine hohe Rechenleistung oder berücksichtigen die lokale räumliche Erhaltung während der Inferenz nicht.
Die Autoren analysieren, dass das Training bei der ursprünglichen Auflösung und der Einsatz asymmetrischer Operationen während des Trainings und der Inferenz der Schlüssel zum Erhalt hochqualitativer und texturreicher Ergebnisse sind. Basierend darauf schlagen sie das Asymmetric Tunable Blind-Spot Network (AT-BSN) vor, bei dem die Größe der Blindstelle frei eingestellt werden kann, um einen besseren Ausgleich zwischen der Unterdrückung der Rauschkorrelation und der Zerstörung der lokalen räumlichen Struktur zu erreichen.
Darüber hinaus betrachten die Autoren das trainierte AT-BSN als Meta-Lehrernetzwerk, das verschiedene Lehrernetzwerke durch Abtastung unterschiedlicher Blindstellen erzeugen kann. Sie schlagen eine Blindstellen-basierte Multi-Lehrer-Destillationsstrategie vor, um ein leichtgewichtiges Netzwerk zu destillieren und die Leistung erheblich zu verbessern.
Die Experimente auf mehreren Datensätzen zeigen, dass die vorgeschlagene Methode den aktuellen Stand der Technik übertrifft und in Bezug auf Rechenaufwand und visuelle Effekte überlegen ist.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Shiyan Chen,... alle arxiv.org 04-12-2024
https://arxiv.org/pdf/2303.16783.pdfDomande più approfondite