Core Concepts
단일 카메라 이미지만을 활용하여 100m 거리까지의 정확한 지형 고도 지도를 실시간으로 예측하는 학습 기반 접근법을 제안합니다.
Abstract
이 연구는 단일 카메라 이미지만을 입력으로 하여 100m 거리까지의 정확한 지형 고도 지도를 실시간으로 예측하는 학습 기반 접근법을 제안합니다. 제안 방법은 다음 3가지 핵심 요소로 구성됩니다:
다중 및 교차 뷰 트랜스포머 기반 인코더: 다양한 관점의 이미지 입력과 이전 고도 지도 예측 간의 연관성을 학습하여 2.5D 고도 지도 공간에 투영합니다.
방향 인식 위치 인코딩: 복잡한 비정형 지형에서의 3D 차량 자세 정보를 시각적 특징과 결합하여 학습에 활용합니다.
히스토리 증강 지도 뷰 임베딩: 이전 예측 결과를 재귀적으로 활용하여 시간에 따른 예측 결과의 일관성을 향상시킵니다.
실제 오프로드 주행 데이터를 활용한 실험 결과, 제안 방법이 기존 최신 기법들에 비해 장거리 지형 고도 지도 예측 정확도와 일관성 측면에서 우수한 성능을 보였습니다. 또한 주요 구성 요소에 대한 심층 분석을 통해 제안 기술의 효과와 적합성을 검증하였습니다.
Stats
차량의 현재 위치에서의 고도는 항상 0m입니다.
제안 모델은 Nvidia RTX 3080 Ti GPU에서 41 FPS의 추론 속도를 달성합니다.
Quotes
"단일 카메라 이미지만을 활용하여 100m 거리까지의 정확한 지형 고도 지도를 실시간으로 예측하는 학습 기반 접근법을 제안합니다."
"제안 방법은 다중 및 교차 뷰 트랜스포머 기반 인코더, 방향 인식 위치 인코딩, 히스토리 증강 지도 뷰 임베딩의 3가지 핵심 요소로 구성됩니다."