Khái niệm cốt lõi
이 논문은 이미지 모달리티에 대한 레이블이 없는 상황에서 이벤트 모달리티로의 크로스 모달 적응을 달성하는 첫 시도를 한다. 이를 위해 재구성 기반 모달리티 브리징 모듈과 다중 표현 지식 적응 모듈을 제안한다.
Tóm tắt
이 논문은 이벤트 기반 객체 인식을 위한 크로스 모달 적응 문제를 다룬다. 이미지 모달리티에 대한 레이블이 없는 상황에서 이벤트 모달리티로의 적응을 달성하는 것이 목표이다.
- 재구성 기반 모달리티 브리징 (RMB) 모듈:
- 이벤트 데이터를 사용하여 이미지 모달리티의 대리 데이터를 구축한다.
- 이를 통해 이미지 모델에서 지식(의사 레이블)을 추출할 수 있다.
- 재구성 모델을 최적화하여 대리 데이터의 품질을 높인다.
- 다중 표현 지식 적응 (MKA) 모듈:
- 다양한 이벤트 표현(스택 이미지, 볼륨 그리드, 이벤트 스파이크 텐서)을 사용하여 타겟 모델을 학습한다.
- 표현 간 예측 일관성 및 소스-타겟 모델 간 일관성 학습을 통해 지식 전달을 수행한다.
두 모듈은 상호 업데이트되어 모달리티 브리징과 지식 적응을 달성한다. 실험 결과 제안 방법이 기존 방법들을 크게 능가함을 보인다.
Thống kê
이벤트 데이터는 시간, 픽셀 위치, 극성(부호)을 인코딩한다.
이벤트 데이터는 비동기적이고 희소하며 주로 에지 정보를 반영한다.
Trích dẫn
"이벤트 카메라는 높은 동적 범위와 모션 블러가 없어 어려운 시각 환경에서 더 유리하다."
"이벤트 데이터만으로도 딥 신경망을 통해 장면 이해 작업, 예를 들어 객체 인식을 수행할 수 있다."