이 논문에서는 PHemoNet이라는 완전 초복소 네트워크를 제안한다. PHemoNet은 생리학적 신호로부터 감정을 인식하기 위한 모델이다.
주요 내용은 다음과 같다:
인코더와 융합 모듈 모두가 초복소 도메인에서 정의된다. 각 입력 신호(EEG, 눈 데이터, GSR, ECG)는 해당 신호의 고유 도메인에서 정의된 인코더에 의해 처리된다. 이를 통해 모달리티별 임베딩을 학습할 수 있다.
개선된 초복소 융합 모듈은 단일 모달리티 임베딩을 결합하여 최종 분류 출력을 생성한다. 이전 연구에 비해 레이어 수를 줄이고 드롭아웃 비율을 높여 과적합을 방지했다.
완전 초복소 아키텍처를 통해 파라미터 수를 줄이고 각 모달리티의 고유 특성을 효과적으로 학습할 수 있어 기존 모델들에 비해 성능이 향상되었다.
실험 결과, PHemoNet은 MAHNOB-HCI 데이터셋에서 각성 및 정서 분류 작업에서 현재 최고 성능을 달성했다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Eleonora Lop... às arxiv.org 10-02-2024
https://arxiv.org/pdf/2410.00010.pdfPerguntas Mais Profundas