Core Concepts
提案手法「GroupedMixer」は、空間チャンネル相関を効率的にモデル化し、高速な符号化速度と優れた圧縮性能を実現する新しいトランスフォーマーベースのエントロピーモデルである。
Abstract
本論文では、学習型画像圧縮のためのエントロピーモデル「GroupedMixer」を提案している。主な特徴は以下の通り:
- 潜在変数をグループ単位に分割し、グループ内のトークンミキサーとグループ間のトークンミキサーを交互に適用することで、空間チャンネル相関を効率的にモデル化する。
- グループ単位の自己回帰を採用することで、高速な符号化を実現する。
- コンテキストキャッシュ最適化を導入し、推論時の計算量を大幅に削減する。
実験結果から、提案手法「GroupedMixer」は従来手法に比べて高い圧縮性能と高速な符号化速度を実現できることが示された。特に、Kodak、CLIC'21 Test、Tecnickデータセットにおいて、従来手法に比べて17.84%、19.77%、22.56%のBD-Rateの改善を達成している。さらに、1秒未満の高速な符号化速度を実現している。
Stats
提案手法「GroupedMixer」は、Kodakデータセットにおいて従来手法に比べて17.84%のBD-Rateの改善を達成した。
提案手法「GroupedMixer」は、CLIC'21 Testデータセットにおいて従来手法に比べて19.77%のBD-Rateの改善を達成した。
提案手法「GroupedMixer」は、Tecnickデータセットにおいて従来手法に比べて22.56%のBD-Rateの改善を達成した。
Quotes
"提案手法「GroupedMixer」は、空間チャンネル相関を効率的にモデル化し、高速な符号化速度と優れた圧縮性能を実現する新しいトランスフォーマーベースのエントロピーモデルである。"
"実験結果から、提案手法「GroupedMixer」は従来手法に比べて高い圧縮性能と高速な符号化速度を実現できることが示された。"