이 연구는 응급실에 입원한 20명의 환자로부터 수집한 음성 데이터셋을 활용하여 자살 위험 평가를 위한 기계 학습 모델을 개발하고 평가했다.
데이터셋에는 세 가지 유형의 음성 활동이 포함되어 있다: 1) 세 가지 짧은 이야기 읽기, 2) 그림 설명하기, 3) 모음 발성하기. 이 음성 데이터에서 다양한 특징을 추출하여 사용했다. 이에는 해석 가능한 음성 및 음향 특징, 딥러닝 기반 스펙트럼 표현, 사전 훈련된 wav2vec 모델의 임베딩이 포함된다.
이 음성 기반 모델에 환자의 메타데이터(인구통계학적 정보, 자살 시도 기록, 총기 접근성 등)를 융합하여 자살 위험 분류 성능을 향상시켰다.
실험 결과, 음성 데이터만으로도 66.2%의 균형 정확도로 자살 위험을 분류할 수 있었다. 메타데이터와 융합하면 94.4%의 균형 정확도로 성능이 크게 향상되었다. 특히 그림 설명 과제의 음성 데이터가 가장 유용한 것으로 나타났는데, 이는 이 과제가 참여자에게 상당한 인지적 부담을 주어 심리 상태를 잘 반영하기 때문으로 추정된다.
이 연구는 응급실에서 자살 위험 평가를 지원하기 위한 비침습적이고 자동화된 음성 기반 접근법을 제시했다. 향후 데이터셋 확장, 새로운 메타데이터 활용, 종단적 데이터 분석 등을 통해 자살 위험 모니터링 및 예측 모델을 발전시킬 수 있을 것으로 기대된다.
To Another Language
from source content
arxiv.org
สอบถามเพิ่มเติม