核心概念
본 연구는 대화 감정 인식 (ERC) 작업을 판별 프레임워크에서 생성 프레임워크로 재구성하여 LLM을 활용하는 새로운 접근법인 InstructERC를 제안한다. InstructERC는 다중 과제 검색 기반 모듈과 화자 식별 및 감정 예측 보조 과제를 통해 대화 관계와 미래 감정 경향을 효과적으로 모델링한다.
摘要
본 연구는 대화 감정 인식 (ERC) 작업을 기존의 판별 프레임워크에서 생성 프레임워크로 재구성하여 LLM을 활용하는 새로운 접근법인 InstructERC를 제안한다.
InstructERC의 주요 구성은 다음과 같다:
-
검색 템플릿 모듈: 지시문, 대화 내용, 레이블 설명, 감정 도메인 검색 등으로 구성되어 다중 수준의 대화 감독 정보를 효과적으로 통합한다.
-
감정 정렬 보조 과제:
- 화자 식별 과제: 대화 참여자의 특성을 모델링하여 감정 표현을 이해하는데 도움을 준다.
- 감정 영향 예측 과제: 대화 참여자 간 관계와 미래 감정 경향을 암묵적으로 모델링한다.
- 통합 데이터셋 실험: 세 개의 벤치마크 데이터셋의 감정 레이블과 화자 레이블을 통일하여 InstructERC의 범용성과 일반화 능력을 검증한다. 데이터 혼합 전략과 데이터 스케일링 실험 결과는 실제 적용 시 유용한 통찰을 제공한다.
InstructERC는 기존 모델들을 크게 능가하는 성능을 보이며, 세 개의 벤치마크 데이터셋에서 종합적인 최신 기술 수준을 달성했다. 또한 매개변수 효율성과 데이터 스케일링 실험을 통해 실제 시나리오에 적용할 수 있는 경험적 지침을 제공한다.
統計資料
대화 한 번에 평균 47개의 발화가 포함되어 있다.
IEMOCAP 데이터셋에는 6개의 감정 레이블이, MELD와 EmoryNLP 데이터셋에는 각각 7개의 감정 레이블이 있다.
引述
"The question is not whether intelligent machines can have emotions, but whether machines without emotions can achieve intelligence", as mentioned in "Society of Mind" (Minsky, 1988).
"Empowering machines with the ability to understand emotions in various scenarios has always been the unwavering direction of researchers."