核心概念
本文提出了一種新的資料增強策略RLE,用於解決跨光譜行人重識別任務中的模態差異問題,並將其歸類為適度變換和徹底變換兩種,並通過實驗證明了其有效性和優越性。
摘要
本文致力於解決跨光譜行人重識別任務中的模態差異問題。基於朗伯模型,作者觀察到非線性模態差異主要來自於作用於不同材質表面時的多樣線性變換。基於此觀察,本文將所有用於跨光譜行人重識別的資料增強策略統一為模擬此類局部線性變換,並將其歸類為適度變換和徹底變換。通過擴展觀察結果,本文提出了一種隨機線性增強(RLE)策略,其中包括適度隨機線性增強(MRLE)和徹底隨機線性增強(RRLE),以突破這兩種變換類型的界限。適度隨機線性增強旨在提供在約束條件下滿足原始線性相關性的多樣圖像變換,而徹底隨機線性增強則試圖直接生成局部線性變換,而不依賴於外部信息。實驗結果不僅證明了RLE的優越性和有效性,也證實了其作為跨光譜行人重識別的通用資料增強策略的巨大潛力。
研究目標
探討跨光譜行人重識別任務中多光譜變換建模的可能性,以提高模型的可解釋性,進一步提升跨光譜行人重識別方法的性能。
方法
基於朗伯反射模型,分析可見光和近紅外圖像中相同區域的照明差異,發現只要區域材質一致,就可以用簡單的線性模型來描述。
將跨光譜資料增強策略分為適度變換和徹底變換兩種,並分別提出了相應的增強方法:
適度隨機線性增強(MRLE):通過對原始圖像通道進行線性計算,在保持原始線性相關性的情況下,提供多樣化的增強結果。
徹底隨機線性增強(RRLE):隨機選擇圖像塊,並乘以一個變化的線性參數,直接模擬局部線性變換。
關鍵發現
跨光譜模態差異主要來自於不同材質表面產生的不同局部線性變換。
現有的資料增強策略可以統一為模擬這種局部線性變換,從而鼓勵網路對變換具有魯棒性。
適度變換和徹底變換可以結合使用,並帶來顯著的性能提升。
主要結論
本文提出的RLE策略,包括MRLE和RRLE,能夠有效地利用上述統一的視角,並將其嵌入到可控的線性變換中。
在跨光譜行人重識別資料集上的大量實驗證明了RLE的有效性和優越性,它可以在各種場景下提升性能。
意義
為跨光譜行人重識別任務中的資料增強策略提供了統一的視角。
提出了新的資料增強策略RLE,有效解決了模態差異問題,提升了跨光譜行人重識別的性能。
局限與未來研究方向
RLE的設計基於跨光譜行人重識別任務的特定觀察,可能不具有像隨機翻轉那樣的通用性。
在極端惡劣天氣下,朗伯模型可能無法很好地工作,RLE的性能可能受到影響。
RegDB和SYSU-MM01資料集在規模和環境方面存在局限性,RLE在開放世界場景中的性能尚未得到驗證。
統計資料
在SYSU-MM01資料集上,結合RLE+RE的基礎網路在all-search模式下,Rank-1準確率達到75.4%,mAP達到72.4%;在indoor-search模式下,Rank-1準確率達到84.7%,mAP達到87.0%。
在RegDB資料集上,結合RLE+RE的基礎網路在VIS to IR的設定下,Rank-1準確率達到92.8%,mAP達到88.6%;在IR to VIS的設定下,Rank-1準確率達到91.0%,mAP達到86.6%。