Core Concepts
소셜 미디어 데이터를 활용하여 사용자의 우울증을 가능한 빨리 정확하게 탐지하는 것이 핵심 목표이다.
Abstract
이 논문은 소셜 미디어 스트림에서 조기 우울증 탐지를 위한 새로운 텍스트 분류 모델 SS3를 제안한다. SS3는 증분 분류, 조기 분류, 설명 가능성이라는 세 가지 핵심 요구사항을 통합적으로 지원하도록 설계되었다.
SS3의 분류 프로세스는 다음과 같다. 먼저 입력 텍스트를 단락, 문장, 단어 등의 계층적 블록으로 분할한다. 그 다음 각 단어의 지역 가치(local value)와 전역 가치(global value)를 계산하여 상위 수준 블록의 신뢰 벡터를 생성한다. 이 신뢰 벡터를 기반으로 분류 결과를 도출한다.
SS3의 학습 과정은 매우 간단하다. 각 카테고리에 대한 단어-빈도 사전만 유지하면 된다. 새로운 문서가 추가되면 해당 사전을 업데이트하는 것으로 학습이 완료된다. 이를 통해 증분 학습이 가능하다.
저자들은 CLEF 2017 eRisk 파일럿 과제의 데이터셋을 사용하여 SS3의 성능을 평가했다. 실험 결과, SS3는 기존 최신 모델들을 능가하는 성능을 보였으며, 동시에 계산 비용이 낮고 분류 결과에 대한 설명이 가능하다는 장점이 있었다.
Stats
우울증 환자 수는 전 세계적으로 약 4.4%에 달한다.
우울증은 비치명적 건강 손실의 단일 최대 기여 요인이다.
저소득 및 중소득 국가에서 80% 이상의 우울증 비치명적 질병 부담이 발생한다.
2005년부터 2015년 사이 우울증 환자 수가 18.4% 증가했다.
Quotes
"언어는 우리가 누구인지를 드러낸다: 우리의 생각, 감정, 신념, 행동 및 성격."
"우울증은 장애의 주요 원인이며 전반적인 전 세계 질병 부담의 주요 기여 요인이다."