이 논문은 도로변 3D 객체 탐지를 위한 혁신적인 시나리오 일반화 프레임워크 SGV3D를 제안한다. 기존 비전 기반 도로변 탐지 방법들은 특정 환경에 과적합되어 새로운 환경에서 성능이 크게 저하되는 문제가 있었다.
SGV3D는 두 가지 핵심 기술로 구성된다. 첫째, 배경 억제 모듈(BSM)은 2D에서 BEV로의 변환 과정에서 배경 특징을 효과적으로 억제하여 배경 과적합을 완화한다. 둘째, 반지도 학습 데이터 생성 파이프라인(SSDG)은 새로운 환경의 무레이블 데이터를 활용하여 다양한 카메라 자세의 전경 객체를 생성함으로써 특정 카메라 자세에 대한 과적합을 방지한다.
실험 결과, SGV3D는 기존 최신 방법들에 비해 새로운 환경에서 차량 +42.57%, 보행자 +5.87%, 자전거 +14.89% 향상된 성능을 보였다. 더 큰 규모의 Rope3D 벤치마크에서도 차량 +14.48%, 대형 차량 +12.41% 향상된 결과를 달성했다. 이를 통해 SGV3D의 강력한 시나리오 일반화 능력을 입증하였다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問