Core Concepts
순환 정서 모델의 연속적인 정서 차원(valence, arousal)을 활용하면 기존의 이산적 범주 기반 접근법보다 더 강력한 얼굴 표정 추론이 가능하다.
Abstract
이 연구는 얼굴 표정 추론을 위해 이산적 범주와 연속적 정서 차원을 통합하는 접근법을 제안한다. 기존의 이산적 범주 기반 접근법은 문화적 배경, 개인 경험, 인지적 편향 등의 요인으로 인해 한계가 있다. 이에 반해, 순환 정서 모델의 valence와 arousal 차원을 활용하면 보다 강력한 추론이 가능하다.
연구진은 AffectNet과 EMOTIC 데이터셋을 심층 분석하여 이산적 범주와 연속적 정서 차원의 특성을 파악했다. 이를 바탕으로 MaxViT 모델 아키텍처를 활용하여 이산적 범주 분류와 연속적 정서 차원 회귀를 통합한 모델을 제안했다.
실험 결과, 제안 모델은 AffectNet 데이터셋에서 기존 최고 모델 대비 valence와 arousal의 RMSE를 각각 7.0%, 6.8% 낮추었고, CCC 지표에서도 valence 0.8%, arousal 2.0% 향상되었다. 또한 EMOTIC 데이터셋에서도 기존 최고 모델 대비 Top-3 정확도를 1.0% 향상시켰다.
이를 통해 순환 정서 모델의 연속적 정서 차원을 활용하면 기존 이산적 범주 기반 접근법보다 더 강력한 얼굴 표정 추론이 가능함을 보였다.
Stats
이산적 범주 기반 모델에 비해 제안 모델은 AffectNet 데이터셋에서 valence RMSE 7.0%, arousal RMSE 6.8% 감소
AffectNet 데이터셋에서 제안 모델의 valence CCC 0.8%, arousal CCC 2.0% 향상
EMOTIC 데이터셋에서 제안 모델의 Top-3 정확도가 기존 최고 모델 대비 1.0% 향상
Quotes
"순환 정서 모델의 연속적인 정서 차원(valence, arousal)을 활용하면 기존의 이산적 범주 기반 접근법보다 더 강력한 얼굴 표정 추론이 가능하다."
"기존의 이산적 범주 기반 접근법은 문화적 배경, 개인 경험, 인지적 편향 등의 요인으로 인해 한계가 있다."