Centrala begrepp
整合時空資訊到物件偵測模型,特別是使用雙串流架構和注意力機制,能顯著提升無人機交通監控中飛行器的偵測準確度,尤其針對卡車和公車等較少見的車輛類別。
論文資訊
Telegraph, K., & Kyrkou, C. (2024). Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring. IEEE Transactions on Artificial Intelligence, 1-13. https://doi.org/10.1109/TAI.2024.3454566
研究目標
本研究旨在探討如何利用時空物件偵測模型,提升無人機於交通監控中偵測飛行器的效能,特別是針對卡車和公車等較少見的車輛類別。
研究方法
建立一個名為「時空車輛偵測資料集」(STVD)的新資料集,包含 6,600 張由無人機拍攝的連續畫面,並標記了三種車輛類別:「汽車」、「卡車」和「公車」。
以 YOLOv5 物件偵測框架為基礎,設計三種時空模型:
畫面配對模型:輸入為兩個連續畫面的六通道張量。
畫面配對和差異模型:在畫面配對模型的基礎上,加入一個單通道張量,表示兩個輸入影像的像素級絕對灰階差異,形成七通道輸入。
雙串流模型:將畫面配對和差異模型的輸入分為兩個串流,分別輸入兩個獨立的骨幹網路,最後將兩個骨幹網路的輸出合併,傳遞到模型頭部進行特徵聚合和預測。
進一步將注意力機制(SENet 和 ECA-Net)整合到時空模型中,以提升模型對重要時空資訊的關注度。
主要發現
相較於單一畫面模型,所有時空模型在 mAP50 指標上均有顯著提升,其中雙串流模型的整體效能提升最為顯著(16.22%)。
時空模型在偵測「卡車」和「公車」等較少見的車輛類別方面表現更佳,顯示時空資訊有助於提升模型對這些類別的偵測能力。
加入注意力機制後,時空模型的整體效能進一步提升,顯示注意力機制有助於模型更精準地關注重要的時空資訊。
主要結論
整合時空資訊到物件偵測模型,特別是使用雙串流架構和注意力機制,能顯著提升無人機交通監控中飛行器的偵測準確度,尤其針對卡車和公車等較少見的車輛類別。
研究意義
本研究提出了一種基於時空物件偵測的無人機交通監控方法,為交通監控系統的發展提供了新的思路,並為交通管理決策提供了更準確、更即時的資訊。
研究限制與未來方向
STVD 資料集規模相對較小,未來可考慮擴充資料集規模,以提升模型的泛化能力。
未來可探討其他注意力機制或時空模型架構,以進一步提升模型效能。
可將本研究方法應用於其他交通監控任務,例如車流統計、車輛軌跡追蹤等。
Statistik
時空車輛偵測資料集 (STVD) 包含 6,600 張連續畫面。
資料集涵蓋三種車輛類別:「汽車」、「卡車」和「公車」。
汽車數量佔大多數,卡車和公車數量較少。
最佳時空模型 (雙串流模型) 的整體 mAP50 提升了 16.22%。
畫面配對模型的推理速度僅比單一畫面模型增加了 0.6 毫秒。