Der Artikel beschreibt eine Methode zur Verbesserung der Kompressionseffizienz von erlernter Bildkompression (Learned Compression, LC). Traditionelle LC-Methoden tendieren dazu, korrelierte Merkmale zu lernen, was die Ausnutzung der Netzwerkkapazität einschränkt. Um dies zu beheben, schlägt der Artikel eine Kanal-basierte Merkmalsdekorrelation vor, die in den Optimierungsprozess der Raten-Verzerrungs-Optimierung (Rate-Distortion Optimization, RDO) integriert wird.
Es werden drei Strategien vorgestellt, um (1) das Transformationsnetzwerk, (2) das Kontextmodell und (3) beide Netzwerke zu optimieren. Die experimentellen Ergebnisse auf zwei etablierten LC-Methoden zeigen, dass die vorgeschlagene Methode die Kompression um bis zu 8,06% verbessern kann, ohne die Komplexität zu erhöhen. Die Lösung kann als Plug-and-Play-Ansatz verwendet werden, um ähnliche LC-Methoden zu optimieren.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Farhad Pakda... ב- arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.10936.pdfשאלות מעמיקות