K-Act2Emo는 한국어 간접적인 감정 표현에 대한 상식 지식 그래프이다. 1,900개의 간접적인 감정 표현과 6,002개의 추론된 노드로 구성되어 있다. 긍정적인 상황(PosEnv), 부정적인 상황(NegEnv), 그리고 감정 단서로 작용하지 않는 표현(NonEmo)에 대한 추론 유형을 새로운 분류법으로 제안하였다. 이를 통해 동일한 행동이라도 맥락에 따라 다른 추론이 가능함을 보여준다. 예를 들어 "그의 얼굴이 붉어진다"는 화남 또는 즐거움을 나타낼 수 있다.
K-Act2Emo는 문학 작품 외에도 뉴스 기사나 온라인 댓글과 같은 비문학 자료에서 간접적인 감정 표현을 수집하였다. 또한 자동 추출 방식의 한계를 극복하기 위해 두 단계의 크라우드소싱 과정을 거쳤다. 첫 번째 단계에서는 간접적인 감정 표현을 수집하고, 두 번째 단계에서는 해당 표현에 대한 감정 추론을 수집하였다.
실험 결과, K-Act2Emo는 기존 상식 지식 그래프보다 간접적인 감정 표현 해석에 더 포괄적인 지식을 가지고 있음을 확인하였다. 또한 K-Act2Emo로 fine-tuning된 모델은 기존 한국어 대규모 언어 모델들을 크게 능가하며, GPT-4 Turbo와 유사한 수준의 성능을 보였다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania