核心概念
深層学習ベースのループフィルタリングを、ルックアップテーブルを活用することで、高速かつ低コンピューティングリソース消費で実現する手法を提案する。
要約
本論文では、深層学習ベースのループフィルタリング手法の課題である高計算量と大メモリ消費を解決するため、ルックアップテーブル(LUT)を活用した効率的な実装手法を提案している。
提案手法の概要は以下の通り:
深層学習ネットワークを小さな参照範囲で事前に学習し、その出力値をLUTに格納する。
LUTの参照範囲を段階的に拡大するための参照インデックスメカニズムと、重み付き参照メカニズムを導入する。
LUTの値を微調整することで、量子化による性能劣化を抑える。
符号化時にLUTを参照することで、深層学習ネットワークの推論を回避し、高速化と低リソース消費を実現する。
提案手法をVVC(Versatile Video Coding)に実装し、評価した結果、従来の深層学習ベースのループフィルタリング手法と比べて、大幅な計算量と処理時間の削減を達成しつつ、良好な符号化性能を示した。特に、超高速モード(LUT-ILF-U)では、従来手法の1/130以下の計算量と1/46以下の処理時間で、BD-rateで0.13%の改善を実現している。
統計
LUT-ILF-Uの計算量は0.13 kMACs/pixelで、従来手法の1/130以下
LUT-ILF-Uの処理時間は従来手法の1/46以下
LUT-ILF-Uのストレージコストは164 KB
引用
"深層学習ベースのコーディングツールは印象的なパフォーマンスを示しているが、重い時間と計算量の複雑さをもたらし、実用的な適用が困難になっている。"
"提案手法は、深層学習ネットワークの強力な適応能力をモデル化し、ルックアップテーブルに格納することで、高速で低リソース消費の実装を実現している。"