核心概念
提出了一個名為CollaMamba的統一框架,利用Mamba架構取代傳統的CNN和Transformer架構,生成緊湊、全面的中間特徵表示,大幅降低計算和通信開銷。同時設計了基於歷史軌跡序列的單代理特徵增強模塊和跨代理協作預測模塊,以提高特徵質量並適應動態通信環境。
摘要
本文提出了一個名為CollaMamba的跨代理協作感知框架,主要包括以下三個部分:
-
跨代理空間協作backbone網絡:
- 採用Mamba編碼器有效捕捉單代理長距離空間依賴,生成緊湊的序列形中間特徵。
- 跨代理融合模塊精確捕捉跨代理和全局場景的特徵相關性和長距離空間依賴,保持線性複雜度。
- 相比CNN和Transformer,大幅降低計算和通信開銷。
-
單代理歷史感知特徵增強模塊:
- 利用長期歷史觀測軌跡序列提取空間時間線索,增強當前模糊特徵。
- 保持線性複雜度,可處理更多歷史幀而不增加開銷。
-
跨代理協作預測模塊:
- 利用歷史全局空間時間軌跡預測當前全局特徵,彌補鄰居代理通信失敗時的缺失信息。
- 使模型能夠適應動態通信環境,在鄰居代理通信失敗時仍能保持較高感知精度。
實驗結果表明,CollaMamba在保持或提高感知精度的同時,大幅降低了計算和通信開銷,在各種基準數據集上均優於現有方法。
統計資料
相比V2X-ViT,CollaMamba的通信量減少約1/64。
CollaMamba-Simple的參數數量和FLOPs分別減少70.9%和71.9%。
CollaMamba-ST的參數數量和FLOPs分別減少60.2%和61.6%。
CollaMamba-Miss的參數數量和FLOPs分別減少53.5%和60.2%。
引述
"CollaMamba是首個在多代理協作感知領域利用Mamba取代傳統CNN和Transformer架構的統一框架,生成緊湊、全面的序列形中間特徵表示,大幅降低計算和通信開銷。"
"我們設計了基於歷史軌跡序列的單代理特徵增強模塊和跨代理協作預測模塊,以提高特徵質量並適應動態通信環境。"
"實驗結果表明,CollaMamba在保持或提高感知精度的同時,大幅降低了計算和通信開銷,在各種基準數據集上均優於現有方法。"