Core Concepts
우울증 증상 추정을 위해 감정, 정서, 도메인 특화 어휘 사전을 활용하는 것이 효과적일 수 있다.
Abstract
이 연구는 우울증 증상 추정을 위해 감정, 정서, 도메인 특화 어휘 사전을 활용하는 방법을 평가했다. 주요 내용은 다음과 같다:
DAIC-WOZ 데이터셋에서는 AFINN, NRC 어휘 사전 활용이 전반적인 성능 향상으로 이어졌다. 특히 우울하지 않은 집단에서 개선 효과가 두드러졌다. 반면 SDD 어휘 사전 활용은 오히려 성능이 저하되었다.
PRIMATE 데이터셋에서는 어휘 사전 활용이 일관된 성능 향상으로 이어지지 않았다. SDD 어휘 사전이 일부 증상에서 가장 좋은 성능을 보였지만, AFINN과 NRC의 효과는 제한적이었다.
이는 데이터셋의 특성 차이에 기인한 것으로 보인다. DAIC-WOZ는 실제 환자-치료사 대화 기반이지만, PRIMATE는 소셜미디어 게시글 기반이다. 또한 PRIMATE의 레이블링 품질이 낮을 수 있다.
전반적으로 어휘 사전 활용이 우울증 증상 추정에 도움이 될 수 있지만, 대상 과제와 데이터셋의 특성에 따라 그 효과가 달라질 수 있다.
Stats
DAIC-WOZ 데이터셋에서 우울증 환자군의 경우 AFINN 어휘 사전 단어가 8.4%, NRC 어휘 사전 단어가 7.6%, SDD 어휘 사전 단어가 0.6% 차지했다.
DAIC-WOZ 데이터셋에서 우울증이 아닌 군의 경우 AFINN 어휘 사전 단어가 8.2%, NRC 어휘 사전 단어가 7.7%, SDD 어휘 사전 단어가 0.4% 차지했다.