Kernkonzepte
실제 환경에서 발생하는 다양한 도메인 변화에 효과적으로 대응하기 위해 다중 기하학적 공간에서의 도메인 간 정렬을 통해 BEV 3D 객체 탐지 성능을 향상시킨다.
Zusammenfassung
이 논문은 BEV 기반 3D 객체 탐지 문제에서 발생하는 도메인 변화 문제를 해결하기 위한 방법을 제안한다.
BEV 기반 3D 객체 탐지 모델은 2D 이미지, 3D 볼륨, BEV 등 다양한 기하학적 공간에서 특징을 추출하는데, 이 과정에서 도메인 변화로 인한 성능 저하가 누적된다.
이를 해결하기 위해 Depth-Aware Teacher (DAT) 모델과 Geometric-space Aligned Student (GAS) 모델로 구성된 Multi-space Alignment Teacher-Student (MATS) 프레임워크를 제안한다.
DAT 모델은 타깃 도메인의 깊이 정보를 활용하여 볼륨 및 BEV 특징을 추출하고, 이를 학생 모델에 전달한다.
GAS 모델은 다중 기하학적 공간의 특징을 공유 기하 임베딩 공간으로 사영하여 도메인 간 분포 차이를 줄인다.
실험 결과, MATS 프레임워크는 다양한 도메인 변화 시나리오에서 SOTA 성능을 달성한다.
Statistiken
기존 BEV 3D 객체 탐지 모델은 환경 변화에 따라 최대 27.7%의 성능 저하가 발생한다.
제안 방법은 환경 변화 시나리오에서 최대 30.8% NDS, 24.7% mAP를 달성한다.
Zitate
"실제 세계의 기계 인지 시스템은 비정상적이고 끊임없이 변화하는 환경에서 작동하므로, 이로 인한 엄청난 성능 저하가 발생한다."
"다중 공간 도메인 변화 누적 문제는 BEV 기반 비지도 도메인 적응에 있어 중요한 과제이다."