이 논문은 열화상 이미징과 RGB 이미징을 통합하여 신경 장면 표현을 구축하는 네 가지 전략을 제안하고 평가한다.
첫 번째 전략은 각 모달리티에 대해 별도로 모델을 학습하는 것이다. 두 번째 전략은 RGB 데이터로 사전 학습한 모델을 열화상 데이터로 미세 조정하는 것이다. 세 번째 전략은 RGB 모델에 두 번째 브랜치를 추가하는 것이다. 네 번째 전략은 별도의 네트워크 구성요소를 추가하여 두 번째 모달리티의 값을 예측하는 것이다.
이를 위해 저자들은 RGB와 열화상 이미지가 완벽하게 정렬된 새로운 데이터셋 ThermalMix를 제안한다. 실험 결과, 세 번째 전략인 RGB-X가 열화상 이미지 재구성에서 가장 우수한 성능을 보였으며, RGB 이미지 재구성에서도 기준 모델과 유사한 성능을 보였다. 또한 저자들은 이 결과가 근적외선 이미지와 깊이 맵에도 일반화됨을 보였다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询