Die Studie präsentiert einen theoretisch fundierten, hierarchischen VAE-basierten Ansatz (BG-VAE) für neuronale Bildcodecs. Der Kern des Ansatzes ist das Bound-Guided Training, bei dem das Codec-Modell durch die Verwendung theoretischer Schranken für die Informationsrate-Verzerrungs-Funktion von Bildern angeleitet wird. Dadurch kann die Leistung des Codec-Modells deutlich gesteigert werden.
Zusätzlich werden effiziente Netzwerkmodule entwickelt, die räumliche und spektrale Informationen effektiv nutzen. Zusammen bilden diese Komponenten das BG-VAE-Framework, das eine vielseitige, variable Bildkompression ermöglicht.
Die Experimente zeigen, dass BG-VAE im Vergleich zu bestehenden Methoden eine deutlich bessere Rate-Verzerrungs-Leistung bei gleichzeitig geringerer Komplexität aufweist. Insbesondere übertrifft BG-VAE den VVC-Standard um bis zu 8,21% in der BD-Rate-Reduktion.
翻譯成其他語言
從原文內容
arxiv.org
深入探究