제안된 방법은 단일 이미지와 소수의 3D 포인트만으로도 정확한 3D 객체 탐지를 가능하게 한다.
본 연구에서는 저비용으로 생성한 가상 LiDAR 포인트 클라우드를 활용하여 3D 객체 탐지 모델의 클래스 불균형 문제를 해결하는 방법을 제안한다.
점군 데이터의 특성을 활용하여 엄격한 필터링을 통해 정확도 높은 의사 레이블을 생성하고, 필터 전환 전략으로 모델의 성능을 향상시킨다.
BEVNeXt는 깊이 추정 정확도 향상, 장기 시간적 집계, 관점 기반 객체 디코더 등의 개선 요소를 통해 기존 밀집 BEV 기반 3D 객체 탐지 프레임워크의 단점을 해결하고 성능을 크게 향상시킨다.
본 연구는 LiDAR 기반 3D 객체 탐지 시스템의 제한된 클래스 어휘와 새로운 객체 클래스에 대한 주석 작업의 높은 비용 문제를 해결하기 위해 개방형 어휘 학습을 탐구합니다. 제안하는 Find n' Propagate 접근법은 새로운 객체의 탐지율을 최대화하고 이를 원격 지역으로 점진적으로 전파하여 더 많은 객체를 포착하는 것을 목표로 합니다.
본 연구는 기존 LiDAR 기반 3D 객체 탐지 시스템의 한계를 극복하고자 합니다. 제한된 클래스 어휘와 새로운 객체 클래스에 대한 주석 작업의 높은 비용이 문제였습니다. 도시 환경에서의 개방형 어휘 학습을 통해 사전 훈련된 비전-언어 모델과 다중 센서 데이터를 활용하여 새로운 인스턴스를 포착하고자 합니다.
이 연구에서는 카메라 전용 버드아이 뷰 3D 객체 탐지를 위해 높이를 명시적으로 모델링하는 방법을 제안한다. 이를 통해 추가 데이터 없이도 높이 정보를 효과적으로 활용할 수 있다.