핵심 개념
서로 다른 모달리티의 특징을 효과적으로 융합하여 객체 탐지 성능을 향상시키는 Fusion-Mamba 방법을 제안한다.
초록
이 논문은 적외선(IR)과 가시광선(RGB) 이미지의 상호보완적인 정보를 효과적으로 융합하여 객체 탐지 성능을 향상시키는 Fusion-Mamba 방법을 제안한다.
주요 내용은 다음과 같다:
- 기존 융합 방법들은 모달리티 간 차이를 고려하지 않아 성능 저하가 발생하는 문제를 해결하고자 한다.
- Fusion-Mamba 블록(FMB)을 제안하여 숨겨진 상태 공간에서 모달리티 간 특징을 상호작용시키고 보완하는 방식으로 융합한다.
- FMB에는 두 가지 핵심 모듈이 있음:
- 채널 스와핑을 통한 얕은 특징 융합 모듈(SSCS)
- 숨겨진 상태 공간에서의 깊은 특징 융합 모듈(DSSF)
- 이를 통해 모달리티 간 차이를 효과적으로 줄이고 융합 특징의 표현력을 향상시킨다.
- 3개의 공개 데이터셋에서 실험한 결과, 기존 최신 방법들을 뛰어넘는 성능을 달성했다.
통계
적외선 이미지만 사용했을 때 보다 RGB와 적외선 이미지를 융합했을 때 LLVIP 데이터셋에서 mAP가 64.3%로 3.0% 향상되었다.
M3FD 데이터셋에서 제안 방법은 mAP 61.9%를 달성하여 기존 최고 성능 대비 5.9% 향상되었다.
FLIR-Aligned 데이터셋에서 제안 방법은 mAP 47.0%를 달성하여 기존 최고 성능 대비 4.9% 향상되었다.
인용구
"기존 융합 방법들은 모달리티 간 차이를 고려하지 않아 성능 저하가 발생하는 문제가 있다."
"Fusion-Mamba 블록(FMB)을 통해 숨겨진 상태 공간에서 모달리티 간 특징을 상호작용시키고 보완하는 방식으로 융합한다."
"제안 방법은 3개의 공개 데이터셋에서 기존 최신 방법들을 뛰어넘는 성능을 달성했다."