핵심 개념
이 논문에서는 다양한 조명 조건에서 강 robust하고 정확한 깊이 추정을 위해 열 이미지와 가시광선 이미지를 통합하는 새로운 프레임워크를 제안합니다.
초록
다중 스펙트럼 이미지를 사용한 적응형 스테레오 깊이 추정 연구 논문 요약
참고: Zihan Qin, Jialei Xu, Wenbo Zhao, Junjun Jiang and Xianming Liu∗. Adaptive Stereo Depth Estimation with Multi-Spectral Images Across All Lighting Conditions. arXiv:2411.03638v1 [cs.CV] 6 Nov 2024.
본 연구는 다양한 조명 조건, 특히 야간이나 우천 시와 같이 기존의 가시광선 기반 깊이 추정 방법의 성능이 저하되는 악조건에서도 강 robust하고 정확한 깊이 추정을 가능하게 하는 새로운 프레임워크를 제안하는 것을 목표로 합니다.
본 연구에서는 입력으로 받은 가시광선 이미지와 열 이미지를 스테레오 쌍으로 취급하고, 두 이미지의 상호 보완적인 정보를 활용하는 새로운 프레임워크를 제안합니다.
Cross-modal Feature Matching
먼저, 입력 가시광선 이미지와 열 이미지를 스테레오 쌍으로 취급하고 두 개의 Cross-modal Feature Matching (CFM) 모듈을 학습시켜 각 픽셀에 대해 정렬된 특징 벡터를 생성합니다. 이 정렬된 특징 벡터를 사용하여 가시광선 특징을 후보 깊이에 걸쳐 열 특징에 투영하여 픽셀 수준 매칭을 위한 비용 볼륨을 생성합니다.
Degradation Masking
열악한 조명 조건으로 인해 매칭이 어려운 영역을 처리하기 위해 Modality-specific Depth Probability (MDP) 모듈을 사용하여 가시광선 이미지에서 각 픽셀의 깊이 확률을 가우시안 분포로 추정하고, 이 확률을 기반으로 저하 마스크를 생성합니다. 이 마스크를 비용 볼륨에 적용하여 부정확한 매칭을 제거합니다.
Depth Map Generation
저조도 영역의 불일치를 단안 열 깊이 추정으로 저하시키기 위해 추가 MDP 모듈을 사용하여 열 이미지의 깊이를 예측합니다. 이 MDP 모듈의 마지막 레이어에서 추출한 특징을 마스킹된 비용 볼륨과 연결합니다. 최종적으로 Depth 모듈을 적용하여 전체 해상도에서 깊이 맵을 생성하고 최종 깊이 맵을 복구합니다. 이를 통해 매칭이 실패한 영역을 단안 열 깊이 추정으로 저하시켜 다양한 조명 조건에서 강력한 결과를 제공합니다.