Core Concepts
본 연구는 SemEval-2024 Task 3 "대화에서의 다중 모달 감정 원인 분석 대회"에 제출된 접근법을 소개한다. 제안된 방법은 감정 분류를 위해 fine-tuned된 GPT-3.5와 BiLSTM 기반 신경망을 활용하여 원인을 추출하는 2단계 파이프라인으로 구성된다. 이 접근법은 가중 평균 비례 F1 점수 0.264를 달성하여 15개 참가팀 중 2위를 차지했다.
Abstract
본 연구는 대화 시스템 개발을 위해 감정 분류와 원인 추출을 결합하는 접근법을 제안한다.
1단계에서는 GPT-3.5를 fine-tuning하여 대화 발화에 대한 감정 유형(중립, 분노, 혐오, 공포, 기쁨, 슬픔, 놀람)을 분류한다. 실험 결과, fine-tuning이 zero-shot 및 few-shot 설정보다 우수한 성능을 보였다. 특히 혐오 감정 분류가 가장 어려운 것으로 나타났다.
2단계에서는 BiLSTM 기반 신경망을 사용하여 감정 발화에 대한 원인 발화를 추출한다. 분석 결과, 원인과 감정 발화 간의 거리가 멀수록 모델의 성능이 낮아지는 경향을 보였다. 또한 일부 경우 감정이 원인 앞에 나타나는 등 데이터 어노테이션의 복잡성이 드러났다.
전체적으로 제안된 접근법은 SemEval-2024 Task 3의 Subtask 1에서 우수한 성능을 보였지만, 감정 분류와 원인 추출의 정확성 향상을 위해서는 데이터 품질 개선이 필요할 것으로 보인다.
Stats
"감정 유형이 분노인 경우 원인 추출의 정확도가 가장 낮습니다."
"대부분의 감정 발화는 자기 자신이 원인입니다."
"감정 발화와 원인 발화 간의 거리가 멀수록 모델의 성능이 낮아집니다."