核心概念
本文提出了一種名為穩定衝突優化對抗訓練(SCAT)的通用對抗訓練框架,用於提升自我監督單眼深度估計模型的領域泛化能力,解決了將對抗資料增強直接應用於自我監督單眼深度估計模型時出現的訓練不穩定和性能下降問題。
摘要
文獻摘要
本研究論文題為「透過穩定對抗訓練提升自我監督單眼深度估計的領域泛化能力」,探討了如何提升自我監督單眼深度估計(MDE)模型在未知場景中的泛化能力。
研究背景
單眼深度估計(MDE)在機器人導航、自動駕駛和 3D 重建等領域中扮演著至關重要的角色。然而,由於現實世界的動態性,即使是環境中的微小擾動也可能導致視覺觀察結果出現顯著的領域偏移,這使得訓練好的模型難以泛化到未知場景,限制了其在現實世界中的應用。
研究問題
現有的自我監督 MDE 模型在面對未知場景時,往往會出現性能下降的問題。這是因為這些模型在訓練過程中,過於依賴於訓練資料集的特定分佈,而無法適應新的、未知的資料分佈。
研究方法
為了提升自我監督 MDE 模型的領域泛化能力,本文提出了一種名為穩定衝突優化對抗訓練(SCAT)的通用對抗訓練框架。SCAT 主要包含兩個創新點:
- 縮放深度網路(SDN):透過調整 UNet 架構中長跳躍連接的係數,降低模型對輸入擾動的敏感性,從而確保更穩定的訓練過程。
- 衝突梯度手術(CGS):逐步整合對抗梯度,引導模型優化朝向無衝突的方向,解決了對抗資料增強造成的過度正則化問題。
實驗結果
在 KITTI、KITTI-C、Foggy CityScapes、DrivingStereo 和 NuScenes 等五個基準資料集上進行的大量實驗表明,SCAT 能夠顯著提升現有自我監督 MDE 方法的泛化能力,並在多個未知領域中實現了最先進的性能。
研究結論
SCAT 為提升自我監督 MDE 模型的領域泛化能力提供了一種有效且通用的解決方案。透過穩定對抗訓練,SCAT 能夠有效地解決訓練不穩定和性能下降的問題,使模型能夠更好地適應未知場景。
統計資料
在 KITTI-C 資料集上,與基準模型相比,SCAT 在平均損壞誤差(mCE)和平均恢復率(mRR)得分上均表現出顯著優勢。
對於 18 種常見的域外損壞類型,SCAT 在幾乎所有指標上都優於競爭對手,為提升現有自我監督單眼深度估計方法的跨域泛化能力提供了一個通用框架。
在真實世界的 NuScenes-Night 資料集上,SCAT 在所有指標上都取得了更好的性能。
引述
"雖然對抗資料增強可以有效地提升多種監督視覺任務的泛化能力,但將其直接應用於自我監督單眼深度估計(MDE)模型中會導致過度正則化,從而導致嚴重的性能下降和訓練崩潰。"
"與 Robust-Depth [19] 中的離線資料增強相比,對抗資料增強(ADA)不對目標分佈做任何假設,並在訓練階段同步優化增強器,提供了一種很有前景的預處理解決方案。"
"我們的探索可能會激勵更多研究人員深入挖掘利用對抗訓練在自我監督 MDE 中的巨大潛力。"