本文提出了一種名為DAOcc的新型多感測器融合三維語義佔用預測框架。
首先,DAOcc採用了簡單高效的多模態特徵提取和融合方法,消除了對複雜變形注意力模塊和單目深度估計的需求。
其次,為了充分利用點雲特徵中固有的幾何結構信息,DAOcc將三維物體檢測作為輔助監督引入,增強了融合特徵的識別能力。
此外,DAOcc引入了一種BEV視角範圍擴展策略(BVRE),提供了更大的BEV視野,提供了更多的上下文信息,並緩解了降低圖像分辨率的不利影響。
實驗結果表明,DAOcc在Occ3D-nuScenes和SurroundOcc基準上取得了最新的最佳成績,同時使用了ResNet50和256x704的輸入圖像分辨率。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zhen Yang, Y... lúc arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19972.pdfYêu cầu sâu hơn