核心概念
본 연구는 감정 간 유사성과 차이를 고려하여 텍스트 감정 예측 성능을 향상시키는 방법을 제안한다. 기존 이진 또는 다중 분류 모델과 달리, 제안 모델은 감정을 서열 척도로 배열하여 오분류 오차를 최소화한다. 나아가 정서와 각성 두 차원을 모두 고려한 2차원 서열 분류 방식을 도입하여 다양한 감정 표현을 효과적으로 포착한다.
摘要
본 연구는 텍스트 감정 예측 성능 향상을 위한 새로운 접근법을 제안한다.
먼저 기존 연구에서 우수한 성능을 보인 RoBERTa-CNN 모델을 감정 분류 기준선으로 수립하였다. 이후 감정을 정서 수준에 따라 서열화하여 기존 분류 모델을 서열 분류 모델로 전환하였다. 이를 통해 오분류 오차를 줄이고 유사한 감정 간 오분류를 더 선호하도록 하였다.
나아가 정서와 각성 두 차원을 모두 고려한 2차원 서열 분류 방식을 제안하였다. 이를 통해 보다 다양한 감정 표현을 효과적으로 포착할 수 있었다. 실험 결과, 제안 모델은 기존 모델 대비 높은 분류 정확도와 F1 점수를 달성하면서도 오분류 오차를 크게 감소시켰다.
統計資料
ISEAR 데이터셋에서 기준선 모델 대비 제안 서열 분류 모델의 오분류 오차 거리가 1 이하인 경우가 더 많았다.
GoEmotions 데이터셋에서 제안 2차원 서열 분류 모델의 F1 점수와 정확도가 각각 0.63과 0.52로 기준선 모델 대비 크게 향상되었다.
引述
"감정 간 유사성과 차이를 고려하여 오분류 오차를 최소화하는 것이 중요하다."
"정서와 각성 두 차원을 모두 고려한 2차원 서열 분류 방식을 통해 다양한 감정 표현을 효과적으로 포착할 수 있다."