本研究では、学習型画像圧縮における可変ビットレート圧縮の課題に取り組む。従来の学習型画像圧縮手法では、各ビットレートに対して別々のエンコーダ・デコーダモデルを学習する必要があり、大量のパラメータを保持する必要があった。
本研究では、差分可微分量子化関数STanHを提案する。STanHは、ハイパボリックタンジェントの和で表される関数であり、量子化関数を滑らかに近似する。STanHのパラメータは学習可能であり、量子化間隔と再構成レベルを適応的に調整できる。
STanHを既存の学習型画像圧縮モデルに組み込むことで、同一モデルで異なるビットレートを実現できる。具体的には、事前学習済みの固定レートモデルにSTanHを追加し、STanHのパラメータのみを微調整することで、様々なビットレートに対応できる。
実験では、Zou22、Xie21、Cheng20の3つの学習型画像圧縮モデルにSTanHを適用し、可変レート圧縮を実現した。その結果、固定レートモデルと同等の圧縮効率を維持しつつ、パラメータ数を50%削減できることを示した。また、アンカーモデルの数を減らすことで、学習コストと保存容量をさらに削減できることも確認した。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor