本文研究了跨域視頻人員重識別的新挑戰,利用合成視頻數據作為源域進行訓練,並在真實世界視頻上進行測試。為此,作者提出了以下創新點:
設計了一種自監督的域不變特徵學習策略,從單幀、單視頻和多視頻組合中學習域不變特徵,以有效地從合成源域遷移到真實目標域。
提出了一種基於自監督ID一致性的師生網絡方案,以提高合成數據訓練的模型在真實數據上的可靠性。通過聚類的方式估計ID一致性,並將其應用於師生網絡的一致性損失。
在五個真實世界數據集上進行了實驗驗證,結果表明所提方法在跨域視頻人員重識別任務上顯著優於現有方法,甚至優於使用真實數據進行訓練。
分析發現,合成數據的樣本豐富性可以縮小合成和真實數據之間的域差距,小於不同真實數據集之間的差距,這解釋了為什麼合成數據在跨域場景下可以優於真實數據。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Xiangqun Zha... о arxiv.org 09-20-2024
https://arxiv.org/pdf/2402.02108.pdfГлибші Запити