핵심 개념
LiDAR 기반 3D 객체 감지에서 고정 프레임 집계 방식은 객체의 움직임에 따라 성능이 저하되는 문제가 발생하는데, VADet은 객체별로 최적의 프레임 수를 가변적으로 집계하여 이러한 문제를 해결하고 더 높은 성능을 달성한다.
초록
VADet: 가변 집계를 사용한 다중 프레임 LiDAR 3D 객체 감지
본 논문은 자율 주행에서 중요한 LiDAR 기반 3D 객체 감지 기술의 성능 향상을 목표로, 기존 고정 프레임 집계 방식의 문제점을 분석하고 이를 해결하기 위한 새로운 접근 방식을 제시한다.
문제점: 기존 LiDAR 3D 객체 감지 모델은 여러 프레임의 정보를 결합하는 고정 프레임 집계 방식을 사용하는데, 이는 객체의 움직임, 특히 빠른 속도를 가진 객체에 대해서는 성능이 저하되는 문제점을 가지고 있다.
해결 방안: 본 논문에서는 객체의 속도와 포인트 밀도를 기반으로 객체별로 최적의 프레임 수를 가변적으로 집계하는 VADet(Variable Aggregation Detection)이라는 새로운 방법을 제안한다.
핵심 기술: VADet은 랜덤 집계 학습(RAT)을 통해 다양한 프레임 수에 대한 모델의 성능을 분석하고, 이를 기반으로 객체의 특성에 따라 최적의 프레임 수를 결정하는 함수 η를 학습한다.
평가: 제안된 방법은 Waymo Open Dataset을 사용하여 CenterPoint, VoxelNeXt, DSVT 등의 최신 3D 객체 감지 모델에 적용하여 평가되었다.