이 논문은 신경형태 비전 센서를 활용한 동작 분할 알고리즘을 제안한다. 제안된 알고리즘은 그래프 변환기 신경망(GTNN)을 사용하여 이벤트 스트림을 3D 그래프로 처리하고 국부적/전역적 시공간 상관관계를 활용하여 움직이는 객체와 배경을 구분한다.
GTNN은 다음과 같은 특징을 가진다:
제안된 알고리즘은 공개 데이터셋(EV-IMO, MOD, EV-IMO2)을 활용하여 학습되었으며, 다양한 실험 시나리오에서 기존 최신 기법들 대비 우수한 성능을 보였다.
추가로, 실험 데이터 수집 및 레이블링을 위한 DOMEL 프레임워크를 제안하였다. DOMEL은 이벤트 스트림과 프레임 기반 센서 데이터를 활용하여 동적 객체 마스크를 생성하고 이를 기반으로 이벤트를 전경/배경으로 자동 레이블링한다. 이를 통해 EMS-DOMEL 데이터셋을 구축하여 공개하였다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yusra Alkend... في arxiv.org 04-18-2024
https://arxiv.org/pdf/2404.10940.pdfاستفسارات أعمق