Der Artikel präsentiert eine Methode zur Bildkompression, die auf Diffusionsmodellen basiert und einen privilegierten End-to-End-Decoder verwendet, um den Sampling-Prozess der Diffusionsmodelle zu korrigieren.
Zunächst wird theoretisch analysiert, wie der Schätzfehler der Score-Funktion, die in den Diffusionsmodellen verwendet wird, durch die Verwendung der Originalbilder als zusätzliche Information korrigiert werden kann. Basierend darauf wird ein End-to-End-Decoder eingeführt, der eine Approximation dieses Korrekturterms berechnet und nur wenige Bits zur Übertragung benötigt.
Die Experimente zeigen, dass die vorgeschlagene Methode sowohl bei Verzerrungsmaßen als auch bei Wahrnehmungsmaßen bessere Ergebnisse erzielt als vorherige Methoden zur wahrnehmungsorientierten Bildkompression. Die Ablationsstudien belegen die Effektivität des Ansatzes, die Diffusionsmodelle durch den privilegierten Decoder zu korrigieren.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы