본 연구는 LiDAR 기반 3D 단일 객체 추적(3D SOT) 문제를 해결하기 위해 PillarTrack이라는 기둥 기반 프레임워크를 제안한다.
첫째, 희소하고 불규칙한 포인트 클라우드를 밀집되고 규칙적인 기둥 표현으로 변환하여 지역적 및 전역적 기하학 정보를 보존한다.
둘째, Pyramid-type Encoding Pillar Feature Encoder(PE-PFE) 설계를 도입하여 각 기둥의 특징 표현을 향상시킨다.
셋째, 모달리티 차이 관점에서 효율적인 트랜스포머 기반 백본을 제안한다.
넷째, 위의 설계를 바탕으로 PillarTrack 추적기를 구축한다.
실험 결과, PillarTrack은 KITTI와 nuScenes 데이터셋에서 최신 성능을 달성하고 실시간 추적 속도를 제공한다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Weisheng Xu,... lúc arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07495.pdfYêu cầu sâu hơn