이 논문은 이벤트 기반 객체 인식을 위한 무감독 소스 프리 크로스 모달 적응 문제를 다룹니다. 이벤트 카메라는 기존 프레임 기반 카메라에 비해 높은 동적 범위와 모션 블러가 없는 장점이 있지만, 대규모 정확하게 레이블된 데이터셋의 부족으로 딥러닝 기반 학습이 어려운 문제가 있습니다.
이를 해결하기 위해 저자들은 이미지 모달리티(소스)에서 학습된 모델의 지식을 이벤트 모달리티(타겟)로 전이하는 크로스 모달 적응 문제를 다룹니다. 특히 소스 이미지 데이터에 접근할 수 없는 상황을 가정하여, 이벤트 데이터만을 이용해 지식을 전이하는 무감독 소스 프리 크로스 모달 적응 문제를 제안합니다.
이를 위해 저자들은 다음과 같은 두 가지 핵심 모듈을 제안합니다:
실험 결과, 제안 방법인 EventDance는 기존 소스 프리 도메인 적응 방법들에 비해 우수한 성능을 보였으며, 소스 데이터를 활용한 방법과 유사한 수준의 성능을 달성했습니다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Xu Zheng,Lin... alle arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14082.pdfDomande più approfondite