Centrala begrepp
본 연구는 전기뇌파(EEG), 심전도(ECG), 피부전도도(GSR) 및 눈 데이터와 같은 다중 모달 생리학적 신호를 활용하여 감정 인식을 수행하는 계층적 초복소수 신경망 모델을 제안한다. 이 모델은 각 모달리티 내의 채널 간 상관관계를 학습하는 인코더와 모달리티 간 상관관계를 학습하는 초복소수 융합 모듈로 구성된다.
Sammanfattning
본 연구는 감정 인식을 위한 다중 모달 접근법을 제안한다. 기존 연구들은 주로 단일 모달리티 또는 수작업 특징 추출에 의존했지만, 감정은 다양한 모달리티에 걸쳐 표현되므로 다중 모달 접근이 더 강력한 분류기를 제공할 수 있다.
제안하는 모델은 계층적 구조를 가지고 있다. 인코더 단계에서는 각 모달리티 내의 채널 간 상관관계를 학습하고, 융합 모듈에서는 모달리티 간 상관관계를 학습한다. 이를 위해 인코더는 초복소수 합성곱(PHC) 연산을 사용하여 단일 모달리티 내의 상관관계를 모델링하고, 융합 모듈은 초복소수 곱셈(PHM) 연산을 사용하여 모달리티 간 상관관계를 모델링한다.
실험 결과, 제안하는 계층적 초복소수 모델은 기존 최신 모델에 비해 arousal 및 valence 분류 성능이 각각 40.20% 및 57.11% 향상되었다. 이는 인코더 단계에서 초복소수 대수를 활용하여 단일 모달리티 내의 상관관계를 효과적으로 학습할 수 있기 때문이다.
Statistik
EEG, ECG, GSR 신호는 128Hz로 다운샘플링되었습니다.
EEG 신호는 10개의 전극(F3, F4, F5, F6, F7, F8, T7, T8, P7, P8)을 사용했습니다.
EEG와 ECG는 1-45Hz, 0.5-45Hz 대역통과 필터링, GSR은 60Hz 저역통과 필터링, 모두 50Hz 노치 필터링을 거쳤습니다.
GSR 신호는 기준선 보정을 수행했습니다.
눈 데이터는 좌우 눈의 평균값을 사용했습니다.
Citat
"감정은 행동적 반응뿐만 아니라 생리학적 반응을 통해서도 표현되므로, 생리학적 접근법이 감정 인식을 위해 점점 더 주목받고 있습니다."
"기존 연구들은 주로 단일 모달리티 또는 수작업 특징 추출에 의존했지만, 감정은 다양한 모달리티에 걸쳐 표현되므로 다중 모달 접근이 더 강력한 분류기를 제공할 수 있습니다."