Core Concepts
자살 위험 수준을 나타내는 문장을 정확하게 식별하고, 전체 게시물의 맥락을 종합적으로 고려하여 자살 위험 증거를 요약하는 통합 방법을 제안합니다.
Abstract
이 연구는 자살 위험 증거 요약을 위해 감독 학습 기반 추출 모델과 생성 모델을 통합하는 방법을 제안합니다.
- 문장 수준의 자살 위험 및 부정적 감정 추정을 위해 BERT 기반 모델을 개발했습니다.
- 자살 위험과 부정적 감정 확률이 모두 높은 문장을 정확하게 식별하여 중요 증거로 선별했습니다.
- MentaLLaMa 프레임워크를 활용한 생성 요약과 선별된 고위험 문장 및 자살 위험 단어 사전 기반 추출 요약을 통합했습니다.
이 접근법은 CLPsych 2024 공동 과제에서 증거 추출 부문 1위와 요약 생성 부문 10위를 달성했습니다. 문장 수준의 자살 위험 평가가 정확한 증거 추출에 크게 기여했지만, 감정 분류는 그렇지 않은 것으로 나타났습니다. 향후 연구에서는 생성 언어 모델을 활용하여 이 프로세스를 자동화하는 방향을 탐색할 것입니다.
Stats
자살 위험 문장 비율이 전문가가 판단한 자살 위험 수준이 높아질수록 증가한다.
부정적 감정 문장 비율이 전문가가 판단한 자살 위험 수준이 낮음에서 중간 수준으로 높아질수록 증가한다.
Quotes
"I want to die / i am suicidal / I've tried to hang myself two times / I don't know how to stop thinking of suicide"
"I'm not about to commit suicide / I wasnt able to kill myself / My last objection to suicide is that/ losing someone to suicide / I haven't considered actually killing myself / my best friend also tried to kill himself / If you're close to killing yourself"