Die Studie präsentiert einen theoretisch fundierten, hierarchischen VAE-basierten Ansatz (BG-VAE) für neuronale Bildcodecs. Der Kern des Ansatzes ist das Bound-Guided Training, bei dem das Codec-Modell durch die Verwendung theoretischer Schranken für die Informationsrate-Verzerrungs-Funktion von Bildern angeleitet wird. Dadurch kann die Leistung des Codec-Modells deutlich gesteigert werden.
Zusätzlich werden effiziente Netzwerkmodule entwickelt, die räumliche und spektrale Informationen effektiv nutzen. Zusammen bilden diese Komponenten das BG-VAE-Framework, das eine vielseitige, variable Bildkompression ermöglicht.
Die Experimente zeigen, dass BG-VAE im Vergleich zu bestehenden Methoden eine deutlich bessere Rate-Verzerrungs-Leistung bei gleichzeitig geringerer Komplexität aufweist. Insbesondere übertrifft BG-VAE den VVC-Standard um bis zu 8,21% in der BD-Rate-Reduktion.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yichi Zhang,... في arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18535.pdfاستفسارات أعمق