這篇研究論文介紹了 HopTrack,這是一個專為嵌入式設備設計的實時多目標追蹤系統。由於嵌入式設備的計算能力和内存資源有限,在這些設備上運行多目標追蹤系統一直是一個挑戰。現有的多目標追蹤方法主要依賴於高性能 GPU,在嵌入式設備上運行時會遇到處理速度慢、準確性低的問題。
HopTrack 通過以下三個創新點解決了這些問題:
不同於現有方法以固定速率或基於關鍵幀採樣視訊幀,HopTrack 根據視訊內容特徵(例如,具有大量目標和遮擋的複雜場景)動態調整採樣率。當場景變得擁擠且包含更多目標時,HopTrack 會提高採樣率以更準確地估計每個目標的運動狀態;當場景較簡單時,HopTrack 會降低採樣率以節省計算資源。
HopTrack 採用一種新穎的兩階段資料關聯方法來提高關聯率。Hop Fuse 演算法在有新的偵測結果時執行,而 Hop Update 則在每個跳躍幀上執行。Hop Fuse 首先使用較高的 IoU 閾值關聯靜止或移動緩慢的目標,然後使用較低的 IoU 閾值關聯移動較快的目標。對於剩餘的未匹配目標,HopTrack 使用基於軌跡的資料關聯和基於淺層特徵的離散靜態和動態匹配來進行關聯。Hop Update 則結合了外觀追蹤器(MedianFlow)和運動追蹤器(卡爾曼濾波器)的優點,以提高追蹤精度。
為了進一步提高資料關聯的準確性,HopTrack 提出了一種基於軌跡的資料關聯方法。與現有的基於 JDE 的方法不同,HopTrack 不會提取深度特徵向量,而是根據目標的卡爾曼濾波器狀態計算其預測軌跡。然後,HopTrack 將未匹配的偵測結果投影到預測軌跡上,並對靠近軌跡的偵測結果執行離散靜態匹配。
HopTrack 使用基於淺層特徵的離散靜態和動態匹配來關聯跨越多個幀且具有較大幀間位移的目標,並抑制不準確的軌跡。靜態匹配在偵測幀上與 Hop Fuse 一起執行,而動態匹配在每個跳躍幀上與 Hop Update 一起執行。
實驗結果表明,HopTrack 在多個資料集(MOT16、MOT17、MOT20、KITTI)上均取得了最先進的精度,同時保持了實時處理速度。此外,HopTrack 還具有低功耗、小内存佔用和資源效率高的優點,非常適合在嵌入式設備上運行。
翻譯成其他語言
從原文內容
arxiv.org
深入探究