核心概念
GAFusion이라는 새로운 3D 객체 감지 방법을 제안하며, 이 방법은 LiDAR 및 카메라 센서 데이터를 효과적으로 융합하여 정확하고 강력한 3D 객체 감지를 가능하게 합니다.
摘要
GAFusion: 다중 안내 기법을 활용한 LiDAR 및 카메라 데이터의 적응형 퓨전 기반 3D 객체 감지
본 연구는 자율 주행 시스템의 핵심 기술인 3D 객체 감지를 위해 LiDAR와 카메라 센서 데이터를 효과적으로 융합하는 새로운 방법인 GAFusion을 제안합니다.
GAFusion은 LiDAR 안내 모듈, 다중 스케일 이중 경로 트랜스포머(MSDPT), LiDAR 안내 적응형 퓨전 트랜스포머(LGAFT), 시간적 퓨전 모듈 등 여러 주요 구성 요소로 이루어져 있습니다.
LiDAR 안내 모듈: 희소 깊이 안내(SDG) 및 LiDAR 점유 안내(LOG)로 구성되어 카메라 특징에 정확한 깊이 정보를 제공합니다. SDG는 LiDAR 포인트 클라우드에서 생성된 희소 깊이 맵을 카메라 특징과 결합하여 깊이 인식 특징을 생성합니다. LOG는 뷰 변환에 의해 생성된 3D 특징 볼륨을 점유 특징으로 안내하여 3D 공간에서 대상에 초점을 맞춥니다.
다중 스케일 이중 경로 트랜스포머(MSDPT): 카메라 특징의 수용 영역을 확대하고 의미 정보를 효과적으로 집계하기 위해 사용됩니다. 로컬 경로와 글로벌 경로로 구성되어 있으며, 3D 컨볼루션을 사용하여 다양한 스케일의 특징을 얻습니다.
LiDAR 안내 적응형 퓨전 트랜스포머(LGAFT): LiDAR BEV 특징과 카메라 BEV 특징을 효과적으로 융합하기 위해 개발되었습니다. LiDAR BEV 특징은 적응적으로 카메라 BEV 특징을 안내하여 전역 범위에서 교차 모달 상호 작용을 강화합니다.
시간적 퓨전 모듈: 여러 프레임에서 대상 상관 관계 및 모션 일관성을 활용하기 위해 이전 프레임의 BEV 특징을 집계합니다.