이 논문은 사건 카메라 데이터 처리를 위한 새로운 접근 방식을 제안한다. 기존의 순환 신경망(RNN) 및 변환기 기반 모델은 학습 시 사용한 주파수와 다른 주파수에서 성능이 크게 저하되는 문제가 있었다. 이를 해결하기 위해 저자들은 상태 공간 모델(SSM)을 사용하여 모델을 설계했다.
SSM은 학습 시 사용한 주파수와 다른 주파수에서도 잘 작동할 수 있는 학습 가능한 시간 척도 매개변수를 가지고 있다. 이를 통해 모델이 다양한 주파수에서 일반화될 수 있다. 또한 SSM은 순환 신경망에 비해 훨씬 빠른 학습 속도를 보인다.
저자들은 SSM 기반 모델의 성능을 높이기 위해 두 가지 전략을 도입했다. 첫째, 주파수 선택적 마스킹을 통해 앨리어싱 효과를 완화했다. 둘째, H2 노름을 손실 함수에 추가하여 고주파 성분을 억제했다.
실험 결과, SSM 기반 모델은 기존 방식에 비해 20 mAP 이상 높은 성능을 보였고, 33% 더 빠른 학습 속도를 달성했다. 이는 SSM이 사건 카메라 데이터 처리에 매우 효과적임을 보여준다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies