Core Concepts
LiDAR 스캔의 희소성으로 인해 발생하는 pseudo-label의 크기 및 위치 오류를 해결하기 위해, 상식 프로토타입을 기반으로 한 무감독 3D 물체 탐지기를 제안한다.
Abstract
이 논문은 무감독 3D 물체 탐지를 위한 Commonsense Prototype-based Detector (CPD)를 제안한다. CPD는 다음과 같은 핵심 구성요소로 이루어져 있다:
다중 프레임 클러스터링(Multi-Frame Clustering, MFC)을 통해 초기 pseudo-label을 생성한다.
완전한 스캔 데이터로부터 상식 프로토타입(Commonsense Prototype, CProto)을 구축하고, CProto의 크기 정보를 활용하여 pseudo-label을 정제한다(CProto-constrained Box Regularization, CBR).
CProto의 기하학적 지식을 활용하여 희소 스캔 물체의 탐지 정확도를 향상시킨다(CProto-constrained Self-Training, CST).
실험 결과, CPD는 기존 최신 무감독 3D 물체 탐지기 대비 큰 성능 향상을 보였다. 특히 KITTI 데이터셋에서 완전 감독 모델과 유사한 수준의 성능을 달성하였다.
Stats
65%의 물체가 완전한 스캔 커버리지를 가지지 않아 정확한 pseudo-label을 생성하지 못한다.
완전 물체와 불완전 물체의 실제 크기 분포는 유사하지만, pseudo-label의 크기 분포는 다르다.
근접한 정지 물체는 연속 프레임에서 높은 완전성을 가진다.
Quotes
"LiDAR 스캔의 희소성과 가림으로 인해 pseudo-label의 크기와 위치가 부정확해지는 문제가 발생한다."
"상식 프로토타입을 활용하여 불완전 물체의 pseudo-label을 정제하고, 희소 스캔 물체의 탐지 정확도를 향상시킬 수 있다."