核心概念
EGIC ist eine neuartige generative Bildkompressionsmetho-de, die es ermöglicht, die Verzerrungs-Wahrnehmungs-Kurve effizient von einem einzigen Modell aus zu durchlaufen. EGIC basiert auf zwei neuartigen Bausteinen: i) OASIS-C, einem bedingten, vortrainierten semantischen Segmentierungs-gesteuerten Diskriminator, der sowohl räumlich als auch semantisch bewusste Gradientenrückmeldungen an den Generator liefert, bedingt durch die latente Bildverteilung, und ii) Output Residual Prediction (ORP), eine leichtgewichtige Nachrüstlösung für die Mehrfach-Realismus-Bildkompression, die es ermöglicht, den Einfluss des Residuums zwischen einem MSE-optimierten und einem GAN-optimierten Decoder-Ausgang auf die GAN-basierte Rekonstruktion zu steuern.
摘要
EGIC ist eine neuartige generative Bildkompressionsmetho-de, die es ermöglicht, die Verzerrungs-Wahrnehmungs-Kurve effizient von einem einzigen Modell aus zu durchlaufen.
EGIC basiert auf zwei Kernbausteinen:
- OASIS-C: Ein bedingter, vortrainierter semantischer Segmentierungs-gesteuerter Diskriminator, der sowohl räumlich als auch semantisch bewusste Gradientenrückmeldungen an den Generator liefert, bedingt durch die latente Bildverteilung.
- ORP: Eine leichtgewichtige Nachrüstlösung für die Mehrfach-Realismus-Bildkompression, die es ermöglicht, den Einfluss des Residuums zwischen einem MSE-optimierten und einem GAN-optimierten Decoder-Ausgang auf die GAN-basierte Rekonstruktion zu steuern.
EGIC übertrifft eine Vielzahl von Diffusions- und GAN-basierten Methoden (z.B. HiFiC, MS-ILLM, DIRAC-100) in Bezug auf die Wahrnehmungsqualität, während es sich in Bezug auf die Verzerrung fast an VTM-20.0, dem aktuellen Stand der Technik für nicht-gelernte Bildcodecs, annähert. Gleichzeitig ist EGIC deutlich speichereffizienter als andere Methoden.
統計資料
Die Bitrate von EGIC (α = 0.0) beträgt 0,159 bpp.
Die Bitrate von EGIC (α = 1.0) beträgt 0,159 bpp.
引述
Keine relevanten Zitate gefunden.