Alapfogalmak
本文提出了一種基於查找表的高效循環內濾波方案,通過訓練深度神經網絡並將其輸出值緩存到查找表中,在編碼過程中通過查表和插值的方式生成濾波後的像素值。該方法在保持良好性能的同時大幅降低了時間和計算複雜度,為實際應用中的神經網絡編碼工具提供了新的實用方案。
Kivonat
本文提出了一種基於查找表的高效循環內濾波方案(LUT-ILF)。主要包括以下步驟:
-
訓練濾波網絡: 在有限的參考範圍內訓練一個輕量級的濾波網絡。
-
緩存網絡到查找表: 通過遍歷所有可能的輸入值,將網絡的輸出值緩存到查找表中。為了降低存儲成本,使用均勻採樣和插值的方式對查找表進行壓縮。
-
查找表微調: 對壓縮後的查找表進行微調,以適應均勻採樣和插值模型。
-
查找表檢索: 在編碼過程中,通過查找表和插值的方式生成濾波後的像素值。
為了進一步提高性能,本文還引入了參考索引、漸進索引和可學習加權等機制,以擴大參考範圍、提高查找表利用率。
實驗結果表明,LUT-ILF在保持良好性能的同時,大幅降低了時間和計算複雜度,為實際應用中的神經網絡編碼工具提供了新的實用方案。
Statisztikák
在全 Intra (AI) 配置下,LUT-ILF-U、LUT-ILF-V和LUT-ILF-F的BD-rate分別為-0.13%、-0.34%和-0.51%。
在隨機訪問(RA)配置下,LUT-ILF-U、LUT-ILF-V和LUT-ILF-F的BD-rate分別為-0.10%、-0.27%和-0.39%。
LUT-ILF-U、LUT-ILF-V和LUT-ILF-F的計算複雜度分別為0.13 kMACs/pixel、0.40 kMACs/pixel和0.93 kMACs/pixel。
LUT-ILF-U、LUT-ILF-V和LUT-ILF-F的存儲成本分別為164 KB、492 KB和1148 KB。
Idézetek
"本文提出了一種基於查找表的高效循環內濾波方案,通過訓練深度神經網絡並將其輸出值緩存到查找表中,在編碼過程中通過查表和插值的方式生成濾波後的像素值。"
"該方法在保持良好性能的同時大幅降低了時間和計算複雜度,為實際應用中的神經網絡編碼工具提供了新的實用方案。"