Główne pojęcia
条件付き拡散モデルは、生成的圧縮タスクにおいて、歪みと知覚の間で新しいトレードオフポイントを作成する可能性がある。
Streszczenie
最近の学習画像圧縮コーデックは、効率的な画像コーディングアーキテクチャを凌駕する印象的な圧縮性能を達成しています。しかし、ほとんどの手法はレートと歪みを最小化するように訓練されており、低ビットレートでは知覚メトリクスが考慮されていないため、視覚的結果が不十分であることがよくあります。この論文では、条件付き拡散モデルが生成的圧縮タスクで有望な結果をもたらすことを示し、圧縮表現が与えられた場合、サンプリング方法に基づいてデコーダー側で歪みと知覚の間で新しいトレードオフポイントを作成できることを示しています。これにより、歪みと知覚の間で新しいトレードオフポイントを作成する可能性があります。
Statystyki
Daniele Mari氏の活動はFondazione CaRiPaRoから支援されました。
ソースコード:https://github.com/Dan8991/Image-coding-perceptual-enhancement-with-diffusion-models.
図1:提案されたネットワークの概要図
Cytaty
"Perception is defined in the framework introduced by Blau et.al. as the similarity between the distributions of the real and processed images."
"We show that diffusion models can produce new Distortion-Perception tradeoffs by tuning the sampling method."
"The proposed scheme achieves very promising results in terms of objective and perceptual quality."