Core Concepts
画像圧縮のためのROI重み付け歪みとビット割り当ての学習方法に焦点を当てる。
Abstract
この論文は、画像圧縮のトラックに関する手法を説明しています。主な焦点は、ROIマスクを使用して異なる領域へのビット割り当てをガイドすることです。TLICチームが提案されました。
Abstract:
Adversarial lossを使用してリアルなテクスチャを生成し、ROIマスクでビット割り当てをガイドします。
Introduction:
学習された画像圧縮は最近注目されており、知覚的品質向上が焦点です。
GANsやVGG、LPIPSベースの学習メトリクスが使用されます。
Method:
TLICアーキテクチャはMa et al.に似ており、可変レート制御にGainとInverse Gainユニットが使用されます。
2つの段階で最適化プロセスが行われます:MSE最適化と知覚的品質最適化。
ROI-Weighted Distortion and Bit Allocation:
Saliency mapをROIマップとして使用し、RMformerで平滑化されたROIマップが生成されます。
ROI地域へのビット割り当てを調整するためにROIマップが直接使用されます。
Adversial Training:
モデルを最適化するためにAdversarial lossが採用され、U-net discriminatorアーキテクチャも使用されます。
Variable Rate Adaptation:
Gain unitsとInverse gain unitsは連続レート適応のために使用されます。
エントロピーモデルはモデルパラメーターを減らすために単純化されました。
Training:
320×320パッチがトレーニング中に使用され、バッチサイズは8に設定されます。
Conclusion:
ROI重み付け率割り当てと歪みを提案しました。U-netベースのdiscriminatorアーキテクチャも採用しました。
Stats
arXiv:2401.08154v3 [cs.CV] 23 Mar 2024