本文針對行人過馬路預測(PCP)問題,提出了一種基於門控合成到真實知識轉移的方法(Gated-S2R-PCP)。
觀察到不同類型的信息(行人位置、RGB圖像、深度圖像和語義圖像)在合成數據和真實數據之間存在不同程度的分布差異,因此需要採用不同的知識轉移方式。
提出三種知識轉移方式:
設計可學習的門控單元(Learnable Gated Unit, LGU),自適應地融合不同知識轉移方式的輸出,以獲得最終的行人過馬路預測特徵。
構建了一個新的大規模合成PCP數據集S2R-PCP-3181,包含3181個序列,共489,740幀,包含行人位置、RGB圖像、深度圖像和語義圖像。
在JAAD和PIE真實數據集上驗證了Gated-S2R-PCP的優越性能,優於現有最先進方法。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jie Bai, Jia... lúc arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.06707.pdfYêu cầu sâu hơn