核心概念
本文提出了一種名為 N2D3 的新型夜晚到白天圖像轉換方法,該方法透過物理信息解糾纏和對比學習來識別和處理夜間圖像中不同的退化模式,從而實現更逼真和結構一致的日間圖像生成,並有利於下游視覺任務。
研究目標
本研究旨在解決夜晚到白天圖像轉換(Night2Day)任務中存在的挑戰,即在將夜間圖像轉換為日間圖像的同時保持語義一致性和結構完整性。
方法
為實現這一目標,研究人員開發了一種名為 N2D3 的新型方法,該方法的核心是照明退化解糾纏模塊和感知退化的對比學習模塊。
照明退化解糾纏模塊
該模塊首先利用基於 Kubelka-Munk 理論的光度模型從夜間場景中提取物理先驗。
然後,根據這些物理先驗,設計了一種解糾纏策略,將夜間圖像中觀察到的不同模式(黑暗、良好照明、高光和光效應)分離出來。
該模塊有效地識別和分離了不同類型的退化,為後續的圖像轉換過程奠定了基礎。
感知退化的對比學習模塊
該模塊旨在約束源圖像和生成圖像在不同區域的相似性,以確保生成的日間圖像保留原始夜間圖像的結構信息。
它採用了兩種策略:感知退化採樣和重新加權。
採樣策略挖掘有價值的錨點和困難負樣本,而重新加權過程則為它們分配權重。
這些策略增強了傳統對比學習的效果,優先考慮具有適當關注度的有價值的圖像塊。
實驗結果
在兩個公共數據集(BDD100K 和 Alderley)上進行的實驗表明,N2D3 在視覺效果和下游任務方面均優於現有最佳方法。
與僅在日間圖像上訓練的典型模型相比,N2D3 在增強夜間語義分割方面表現最佳,mIoU 顯著提高了 5.95。
定性和定量結果都證明了 N2D3 在生成逼真日間圖像的同時有效保留結構的能力,即使在雨夜等具有挑戰性的場景中也是如此。
結論
N2D3 方法透過其新穎的退化解糾纏和對比學習策略,為 Night2Day 圖像轉換任務提供了一種有效的解決方案。
該方法在視覺保真度和結構保留方面取得的顯著成果,使其在下游視覺任務(如機器人定位和夜間環境語義分割)中具有廣泛的應用前景。
統計資料
N2D3 在 BDD100K 數據集上實現了 31.5 的 FID 分數和 0.466 的 LPIPS 距離,顯著優於之前最佳方法。
在 Alderley 數據集上,N2D3 的 FID 分數為 50.9,LPIPS 距離為 0.650,SIFT 分數為 16.62,同樣優於其他方法。
與直接在夜間圖像上進行推理相比,N2D3 在夜間語義分割任務中使 mIoU 提高了 5.95。