Die Studie präsentiert einen theoretisch fundierten, hierarchischen VAE-basierten Ansatz (BG-VAE) für neuronale Bildcodecs. Der Kern des Ansatzes ist das Bound-Guided Training, bei dem das Codec-Modell durch die Verwendung theoretischer Schranken für die Informationsrate-Verzerrungs-Funktion von Bildern angeleitet wird. Dadurch kann die Leistung des Codec-Modells deutlich gesteigert werden.
Zusätzlich werden effiziente Netzwerkmodule entwickelt, die räumliche und spektrale Informationen effektiv nutzen. Zusammen bilden diese Komponenten das BG-VAE-Framework, das eine vielseitige, variable Bildkompression ermöglicht.
Die Experimente zeigen, dass BG-VAE im Vergleich zu bestehenden Methoden eine deutlich bessere Rate-Verzerrungs-Leistung bei gleichzeitig geringerer Komplexität aufweist. Insbesondere übertrifft BG-VAE den VVC-Standard um bis zu 8,21% in der BD-Rate-Reduktion.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문