本研究では、3次元点群処理における物体検出の精度向上を目的とした、POP-RCNNと呼ばれる新しい手法を提案している。
POP-RCNNの主な特徴は以下の通りである:
ポイントピラミッド構造を用いて、多重スケールのフィーチャーを効果的に融合する。これにより、空間スケールと意味的深さの間の情報交換を促進し、特徴表現の豊富化を実現する。
距離に依存しない特徴表現を得るため、距離に応じた点密度の情報を活用する距離依存型の密度信頼スコアリング手法を導入する。
提案手法をボクセルベースおよびポイントボクセルベースの既存手法に適用し、特に遠距離の物体検出精度を大幅に向上させることを示す。
具体的には、Waymo Open Datasetでは、ベースラインと比較して、Vehicle LEVEL 1カテゴリで2.30%、Vehicle LEVEL 2カテゴリで2.88%の精度向上を達成している。また、KITTI datasetでも、Carカテゴリの中程度難易度で0.63%、ポイントベースの手法PV-RCNNでは0.66%の精度向上を示している。特に遠距離の物体検出においても大幅な精度向上が確認された。
以上のように、POP-RCNNは多重スケールフィーチャーの効果的な融合と距離依存型の特徴表現により、3次元物体検出の精度を大幅に向上させることができる。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Weihao Lu, D... lúc arxiv.org 09-10-2024
https://arxiv.org/pdf/2409.04601.pdfYêu cầu sâu hơn