핵심 개념
트위터 데이터를 활용하여 5가지 주요 우울증 유형(양극성 장애, 비전형 우울증, 정신병성 우울증, 주요 우울장애, 산후 우울증)을 정확하게 예측할 수 있는 모델을 개발하였다.
초록
이 연구는 트위터 데이터를 활용하여 우울증의 5가지 주요 유형을 예측하는 것을 목표로 하였다. 먼저 전문가 검증을 거친 우울증 관련 키워드를 사용하여 트위터 데이터를 수집하였다. 수집된 데이터는 맥락을 고려하여 수작업으로 라벨링되었다. 이후 BERT 모델을 활용하여 특징 추출 및 모델 학습을 진행하였다. 또한 설명 가능한 AI 기법을 적용하여 모델의 예측 과정을 설명할 수 있도록 하였다. 실험 결과, 제안된 모델은 96%의 높은 정확도로 우울증 유형을 예측할 수 있었다.
통계
우울증 환자의 트위터 데이터에는 "나는 양극성 장애를 앓고 있다", "나는 비전형 우울증을 앓고 있다", "나는 주요 우울장애를 앓고 있다" 등의 문구가 포함되어 있다.
정신병성 우울증 환자의 트위터 데이터에는 "나는 정신병성 우울증을 앓고 있다", "나는 망상성 우울증을 앓고 있다" 등의 문구가 포함되어 있다.
산후 우울증 환자의 트위터 데이터에는 "나는 산후 우울증을 앓고 있다", "출산 후 우울증이 왔다" 등의 문구가 포함되어 있다.
인용구
"나는 양극성 장애를 앓고 있어요. 기분이 너무 들쭉날쭉해요."
"비전형 우울증 때문에 식욕이 늘어나고 체중이 늘었어요."
"정신병성 우울증 때문에 환각과 망상에 시달리고 있어요."