核心概念
拡散モデルを使用した画像圧縮において、スコアベース生成モデルが高いパフォーマンスを発揮することが示された。
摘要
本論文では、拡散モデルを調整して、画像圧縮向けに特化させた改良点が示されています。スケジュールの変更などの工夫により、細部への焦点を当てることで高いリアリズムを実現しました。また、他の手法と比較してFID評価指標で優れた結果を達成しました。
統計資料
PO-ELIC: 171.7%
HFD (Ours): 188.6%
HiFiC: 267.3%
MSE (Ours): 100%
VVC: 321.2%
HEVC: 340.0%
JPEG: 225.8%
引述
"Despite the tremendous success of diffusion generative models in text-to-image generation, replicating this success in the domain of image compression has proven difficult."
"In this paper, we demonstrate that diffusion can significantly improve perceptual quality at a given bit-rate, outperforming state-of-the-art approaches PO-ELIC and HiFiC as measured by FID score."
"Our method is conceptually simple, applying a diffusion model on top of a distortion-optimized autoencoder."
"We find that trying to repurpose text-to-image models for the task of image compression does not yield good results."
"An important property of a diffusion model is its noise schedule, which determines how quickly information is destroyed and how much computation is spent on the generation of coarse or fine details of an image."