이 논문은 단일 이미지와 희소하고 노이즈가 있는 레이더 데이터를 융합하여 정확한 메트릭 깊이 추정 방법을 제안합니다. 제안하는 방법은 4단계로 구성됩니다:
첫 번째 단계에서는 강력하고 일반화된 단일 이미지 기반 깊이 예측 네트워크를 활용합니다. 두 번째 단계에서는 다양한 전역 정렬 방법을 통해 척도 없는 깊이 예측과 레이더 깊이를 정렬합니다. 세 번째 단계에서는 변환기 기반 네트워크를 통해 레이더 포인트와 이미지 패치 간의 연관성을 학습하여 준밀집 척도 맵을 추정합니다. 마지막으로 네 번째 단계에서는 준밀집 척도 맵을 이용하여 국소적으로 깊이 척도를 정제합니다.
제안하는 방법은 nuScenes 데이터셋과 자체 수집한 ZJU-4DRadarCam 데이터셋에서 기존 방법 대비 큰 성능 향상을 보였습니다. 특히 nuScenes 데이터셋에서 기존 최고 성능 대비 MAE 25.6%, RMSE 20.9% 감소를 달성했으며, ZJU-4DRadarCam 데이터셋에서는 MAE 40.2%, RMSE 40.1% 감소를 보였습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문