Core Concepts
실제 뉴스 영상에서 추출한 얼굴 표정 데이터를 활용하여 감정 인식 모델의 성능을 체계적으로 평가하고 벤치마킹하는 것이 이 연구의 핵심 목적이다.
Abstract
이 연구는 실제 뉴스 영상에서 추출한 얼굴 표정 데이터를 활용하여 감정 인식 모델의 성능을 체계적으로 평가하고 벤치마킹하는 것을 목적으로 한다.
데이터 수집 및 전처리 과정에서는 318개의 뉴스 영상에서 얼굴 이미지를 추출하고, 이를 5가지 기본 감정 범주(화남, 두려움, 행복, 중립, 슬픔)로 레이블링하였다. 이를 통해 총 14,172개의 얼굴 이미지 데이터셋을 구축하였다.
다양한 그래프 신경망 모델(GCN, ChebNet, GAT, GraphSAGE, DGCNN, ECC, Spatial GCN, GIN 등)을 활용하여 얼굴 랜드마크 데이터를 분석하고 감정 인식 성능을 평가하였다. 실험 결과, GINFormer 모델이 가장 우수한 성능을 보였으며, 특히 행복 감정 인식에서 49.5%의 정확도를 달성하였다.
이 연구는 실제 뉴스 영상 데이터를 활용한 감정 인식 벤치마킹 프레임워크를 제시함으로써, 향후 감정 인식 기술 발전에 기여할 것으로 기대된다. 또한 얼굴 랜드마크 기반 감정 인식 모델의 성능과 한계를 체계적으로 분석하여, 실용적인 응용 분야에 적용할 수 있는 기반을 마련하였다.
Stats
행복 감정 인식 정확도: GINFormer 46.5%, SAGE 49.5%
슬픔 감정 인식 정확도: MLP 40.5%
두려움 감정 인식 정확도: GINFormer 45.5%
중립 감정 인식 정확도: SAGE 43.0%
화남 감정 인식 정확도: GIN 36.5%
Quotes
"실제 뉴스 영상에서 추출한 얼굴 표정 데이터를 활용하여 감정 인식 모델의 성능을 체계적으로 평가하고 벤치마킹하는 것이 이 연구의 핵심 목적이다."
"GINFormer 모델이 가장 우수한 성능을 보였으며, 특히 행복 감정 인식에서 49.5%의 정확도를 달성하였다."