核心概念
理論的上限値を活用することで、既存の画像圧縮手法の性能を大幅に向上させることができる。
要約
本研究では、理論的上限値を活用した階層的VAE (BG-VAE)を提案している。
- 理論的上限値を活用することで、既存の画像圧縮手法の性能を大幅に向上させることができる。
- 階層的VAEを用いることで、画像の粒度の異なる特徴を効果的にモデル化できる。
- 特徴の類似性を表すアフィニティ行列を用いた特徴アラインメントにより、教師モデルの知識を効果的に学生モデルに転移できる。
- 提案手法は、既存の画像圧縮手法と比較して、パラメータ数が少なく、高速な推論が可能である。
- 実験結果から、提案手法が既存手法を大きく上回る性能を示すことが確認された。
統計
既存の画像圧縮手法と比較して、提案手法はKodakデータセットで7.04%、Tecnickデータセットで8.21%、CLIC2022データセットで6.33%のBD-Rateの改善を達成した。
提案手法のパラメータ数は97.4Mと少なく、CPUでの推論時間は0.990秒、GPUでの推論時間は0.082秒と高速である。
引用
"理論的上限値を活用することで、既存の画像圧縮手法の性能を大幅に向上させることができる。"
"階層的VAEを用いることで、画像の粒度の異なる特徴を効果的にモデル化できる。"
"特徴の類似性を表すアフィニティ行列を用いた特徴アラインメントにより、教師モデルの知識を効果的に学生モデルに転移できる。"