核心概念
本文提出了一個針對光流估計魯棒性的基準測試,包含針對真實世界場景中常見損壞的全面評估,並分析了不同光流估計方法的魯棒性表現。
文獻資訊
Yi, Z., Shi, H., Jiang, Q., Gao, Y., Wang, Z., Zhang, Y., ... & Wang, K. (2024). Benchmarking the Robustness of Optical Flow Estimation to Corruptions. arXiv preprint arXiv:2411.14865v1.
研究目標
本研究旨在建立一個全面的基準測試,用於評估光流估計方法在面對真實世界場景中常見圖像損壞時的魯棒性。
方法
提出了七種針對光流應用的時間性損壞,並結合十七種針對單張影像的經典損壞,構建了兩個新的魯棒性基準測試:KITTI-FC 和 GoPro-FC。
KITTI-FC 基於 KITTI-2015 光流基準測試,側重大位移場景;GoPro-FC 基於 GoPro 數據集,側重小位移場景。
引入了新的魯棒性指標:損壞魯棒性誤差 (CRE)、損壞魯棒性誤差比 (CREr) 和相對損壞魯棒性誤差 (RCRE),用於量化光流估計的魯棒性。
評估了 15 種主流光流估計方法的 29 種模型變體,涵蓋傳統方法、監督學習模型和無監督學習模型。
主要發現
模型的絕對魯棒性很大程度上取決於其估計性能。
SAMFlow 和 CSFlow 在監督學習模型中表現出優異的估計性能和絕對魯棒性。
無監督學習方法對損壞的穩定性更高。
監督學習方法在域內場景中的相對魯棒性下降,主要原因是在天氣條件下的不穩定性。
考慮計算成本後,無監督學習方法的優先級最高。
低光和過度曝光分別比高光和曝光不足更為嚴重。
導致局部信息丟失的損壞比僅降低視覺效果的損壞影響更大。
結論
本文提出的基準測試和評估指標為評估和比較不同光流估計方法的魯棒性提供了一個標準化的框架。
研究結果為設計更魯棒的光流估計模型提供了參考,例如引入 Transformer 架構、語義信息、無監督學習方法等。
意義
本研究為光流估計的魯棒性研究奠定了基礎,並將促進更可靠的光流估計方法的發展,以應對真實世界場景中的挑戰。
局限性和未來研究方向
本研究主要關注常見的圖像損壞,未來可以考慮更廣泛的損壞類型,例如運動模糊、遮擋等。
可以進一步研究不同損壞類型之間的相互影響,以及如何設計更通用的魯棒性評估指標。
統計資料
本文提出了 7 種時間性損壞,並結合 17 種經典的單張影像損壞,共計 24 種損壞類型。
KITTI-FC 基於 KITTI-2015 光流基準測試,包含 200 對帶有光流真值的圖像對。
GoPro-FC 基於 GoPro 數據集,包含 5 個具有挑戰性的動態視頻序列。
評估了 15 種主流光流估計方法的 29 種模型變體。
實驗結果表明,無監督學習方法 ARFlow 在 KITTI-FC 域內場景中表現出最佳的絕對魯棒性和相對魯棒性。