Core Concepts
언어 모델을 사용하여 꿈 이야기에서 등장인물과 그들의 감정을 자동으로 탐지할 수 있다.
Abstract
이 연구는 꿈 이야기에서 등장인물과 감정을 자동으로 탐지하는 방법을 제안합니다.
- 꿈 이야기 데이터베이스인 DreamBank에서 수집된 1,766개의 영어 꿈 이야기를 사용했습니다.
- 이야기에 등장하는 등장인물의 상태, 성별, 정체성, 나이와 등장인물의 감정(분노, 불안, 슬픔, 혼란, 행복)을 코드화한 Hall and Van de Castle (HVdC) 체계를 활용했습니다.
- 등장인물과 감정을 자연어로 변환하여 시퀀스-투-시퀀스 언어 모델로 학습시켰습니다.
- 모델 크기, 등장인물 예측 순서, 코드의 자연어 변환 방식 등 다양한 요인이 성능에 미치는 영향을 분석했습니다.
- 대규모 언어 모델을 활용한 접근법과 비교했을 때, 제안한 감독 학습 모델이 더 나은 성능을 보였습니다.
- 개발된 모델과 주석이 달린 DreamBank 데이터셋을 공개하여 꿈 연구 분야에 기여하고자 합니다.
Stats
꿈 이야기에는 평균 2.8개의 등장인물이 나옵니다.
1,766개의 꿈 이야기 중 45개에는 등장인물이 없습니다.
감정이 포함된 꿈 이야기는 885개이며, 감정이 포함된 이야기에는 평균 1.6개의 감정이 나타납니다.
꿈꾸는 사람 자신이 경험하는 감정이 전체 감정의 3/4을 차지합니다.