이 연구에서는 지역 단위의 정신 건강 상태를 트위터 데이터를 활용하여 예측하는 새로운 프레임워크인 LocalHealth를 제안한다.
데이터 수집 단계에서는 765개의 지역(센서스 블록 그룹)에서 5년 동안 수집한 2,200만 건의 트윗을 활용하였다. 이를 통해 지역 단위 정신 건강 예측을 위한 벤치마크 데이터셋인 LocalTweets를 구축하였다.
LocalHealth 모델은 트윗 텍스트를 언어 모델로 인코딩하고 합성곱 신경망과 완전 연결 신경망을 통해 정신 건강 상태를 예측한다. 실험 결과, LocalHealth는 GPT-3.5 모델을 활용할 경우 F1 점수 0.7429, 정확도 79.78%를 달성하여 제로 샷 설정에서 GPT-3.5 대비 59% 향상된 성능을 보였다. 또한 LocalHealth를 활용하여 보고되지 않은 지역의 정신 건강 상태를 추정할 수 있었다.
이 연구는 지역 단위 실시간 정신 건강 감시 시스템 개발을 위한 기반을 마련했다. 제안된 접근법은 정신 건강 관리 자원이 필요한 지역을 식별하고 지역 사회 정신 건강 프로그램을 수립하는 데 활용될 수 있다.
To Another Language
from source content
arxiv.org
Дополнительные вопросы