이 연구는 자연스러운 대화 상황에서 참여도를 예측하기 위해 다중 모달 데이터와 LLM을 활용하는 방법을 소개한다. 연구팀은 34명의 참여자가 19쌍의 대화를 나누는 데이터셋을 수집했다. 이 데이터셋에는 대화 내용 전사, 시선 추적, 표정 분석 등 다양한 행동 데이터가 포함되어 있다.
연구팀은 이 데이터를 활용하여 두 가지 실험을 진행했다. 첫째, 전통적인 기계학습 기법을 사용하여 다중 모달 데이터를 융합하고 참여도를 예측했다. 둘째, LLM을 활용하여 다중 모달 대화 내용을 생성하고 이를 바탕으로 참여도를 예측했다.
LLM 기반 접근법은 전통적인 기법과 유사한 수준의 성능을 보였다. 특히 참여도의 긍정/부정 여부(valence)를 예측하는 데 효과적이었다. 그러나 참여도의 강도(arousal)를 예측하는 데는 어려움을 겪었다. 이는 LLM이 긍정적인 편향을 가지고 있어 부정적인 반응을 잘 모델링하지 못하기 때문으로 보인다.
이 연구는 LLM을 활용하여 실제 대화 상황에서의 참여도를 예측하는 새로운 접근법을 제시했다. 향후 연구에서는 LLM의 편향을 해결하고 다양한 대화 상황에 적용할 수 있는 방법을 모색할 필요가 있다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Chen... às arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09135.pdfPerguntas Mais Profundas