核心概念
Eine effiziente Methode zur Verbesserung der Videoauflösung, die eine diskriminative Ausrichtungskorrektur und eine kollaborative Rückkopplungspropagation nutzt, um die Auswirkungen von Artefakten zu reduzieren und räumlich-zeitliche Informationen besser zu erfassen.
要約
Der Schlüsselerfolg bestehender Methoden zur Videoauflösung (VSR) basiert hauptsächlich auf der Erkundung räumlicher und zeitlicher Informationen, die normalerweise durch ein rekurrentes Propagationsmodul mit einem Ausrichtungsmodul erreicht wird. Allerdings führen ungenaue Ausrichtungen oft zu ausgerichteten Merkmalen mit signifikanten Artefakten, die sich während der Propagation ansammeln und die Videorekonstruktion beeinflussen. Außerdem können Propagationsmodule nur Merkmale desselben Zeitschritts vorwärts oder rückwärts propagieren, was bei komplexer Bewegung oder Verdeckung versagen kann.
Um diese Probleme anzugehen, schlagen die Autoren eine kollaborative Rückkopplungspropagation (CFP) vor, die Informationen aus Vorwärts- und Rückwärtspropagation gleichzeitig nutzt, um räumlich-zeitliche Informationen besser zu erfassen. Außerdem entwickeln sie eine diskriminative Ausrichtungskorrektur (DAC), um die Auswirkungen von Artefakten in den ausgerichteten Merkmalen zu reduzieren.
Die Autoren integrieren ihre Methode in gängige VSR-Netzwerke und zeigen, dass sie die Leistung bestehender Modelle signifikant verbessern kann, ohne die Modellkomplexität und den Rechenaufwand erheblich zu erhöhen.
統計
Die vorgeschlagene Methode kann die PSNR-Werte auf dem REDS4-Datensatz um 0,37 dB und auf dem Vimeo-T(BD)-Datensatz um 0,42 dB im Vergleich zu BasicVSR verbessern.
Das CFD-BasicVSR++-Modell erreicht den besten Leistungswert auf dem REDS4-Datensatz und den zweitbesten Wert auf anderen Benchmarks, bei nur 23% der Parameter von VSRT.
Das CFD-BasicVSR++-Modell übertrifft VRT um 0,32 dB PSNR auf dem REDS4-Datensatz, bei nur 21% der Parameter.
引用
"Die Schlüsselerfolge bestehender Methoden zur Videoauflösung (VSR) basieren hauptsächlich auf der Erkundung räumlicher und zeitlicher Informationen, die normalerweise durch ein rekurrentes Propagationsmodul mit einem Ausrichtungsmodul erreicht wird."
"Allerdings führen ungenaue Ausrichtungen oft zu ausgerichteten Merkmalen mit signifikanten Artefakten, die sich während der Propagation ansammeln und die Videorekonstruktion beeinflussen."
"Außerdem können Propagationsmodule nur Merkmale desselben Zeitschritts vorwärts oder rückwärts propagieren, was bei komplexer Bewegung oder Verdeckung versagen kann."