核心概念
利用擴散模型有效壓縮協作代理的感知資訊,在滿足實際無線通信限制的情況下實現特徵級別的協作。
摘要
本文提出了一種名為DiffCP的新型協作感知(CP)範式,利用專門的擴散模型有效壓縮協作代理的感知資訊。DiffCP通過將幾何和語義條件納入生成模型,實現了特徵級別的協作,大幅降低了通信成本,推動了連接式協作機器人系統在實際環境中的部署和應用。
具體來說,DiffCP首先從預訓練的BEV感知算法中提取BEV特徵。然後,DiffCP嵌入擴散時間步長、相對地理位置和語義向量作為條件,引導幾何變換和額外信息的融合,以重建協作代理的BEV特徵。與傳統單視角3D合成不同,每個代理在DiffCP中都包含獨特的前景信息,因此DiffCP同時考慮幾何和語義條件。通過在通用BEV潛在空間中進行擴散,DiffCP減少了推理維度,支持多傳感器模態,並可適應多樣的下游任務。
實驗結果表明,DiffCP可以在保持特徵級別協作優勢的同時,將通信成本顯著降低至物體級別CP的水平,甚至超越,為實際應用提供了可行的解決方案。此外,DiffCP還提出了一種針對高精度任務的下游感知增強方法,進一步提高了感知性能。
統計資料
在10米距離下,當前C-V2X系統的最大數據率約為10 Mbps,在100米距離下降至5 Mbps。
原始LiDAR數據的傳輸需要約360 Mbps,單個HD攝像頭需要約20 Mbps,遠超C-V2X頻寬。
DiffCP可將通信成本從745 Mbps降低至87.8 Kbps,實現14.5倍壓縮,與SOTA算法保持相同的感知性能。
引述
"DiffCP是首次利用擴散模型捕捉幾何相關性和語義線索,實現高效數據傳輸的CP架構。"
"DiffCP可無縫集成到現有的BEV協作算法中,大幅降低通信成本,促進連接式協作機器人系統在實際環境中的部署。"