本研究では、ニューラル画像圧縮における量子化の影響を軽減するための量子化整流器(QR)を提案している。
量子化は画像圧縮において重要な役割を果たすが、量子化によってデータの精度が失われ、画質の劣化につながる問題がある。既存の手法では、量子化によるトレーニングとテストの不一致問題に取り組んでいるが、量子化が特徴量の表現力に及ぼすランダムな影響は未解決のままである。
本研究のQRは、画像の空間相関を活用して量子化前の特徴量を予測することで、特徴量の表現力を保持し、圧縮効率を向上させる。また、QRを既存のニューラル画像圧縮モデルに統合するための「ソフトから予測」トレーニング手法を開発している。
評価実験では、QRを最新のニューラル画像圧縮モデルに適用し、PSNR平均で最大0.21dB、MS-SSIM平均で最大0.25dBの画質向上を達成している。さらに、ほとんどのモデルでQRの追加によるランタイムコストの増加は5.4%以下と小さい。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問