이 연구는 국가폭력사망보고시스템(NVDRS) 데이터에서 발견되는 주석 불일치 문제를 다룬다. 주석 불일치는 자살 원인 분석의 정확성을 저해하므로 이를 해결하는 것이 중요하다.
연구진은 다음과 같은 접근법을 사용하였다:
주석 불일치 검증: 타 주와 대상 주의 데이터를 활용하여 주석 불일치를 확인하였다. 대상 주의 데이터를 훈련 데이터에 포함시킬 경우 대상 주의 성능은 향상되지만 타 주의 성능은 저하되는 것을 확인하였다. 이는 주석 불일치가 존재함을 시사한다.
문제 인스턴스 식별: 교차 검증 기반 접근법을 통해 주석 오류가 의심되는 인스턴스를 식별하였다. 오하이오 주의 경우 가족 관계 위기 14.8%, 신체 건강 위기 13.9%, 정신 건강 위기 1.5%의 인스턴스가 잠재적 오류로 확인되었다.
주석 일관성 검증: 식별된 문제 인스턴스를 제거하고 모델을 재학습한 결과, 타 주 테스트 세트의 평균 F1 점수가 3.85% 향상되었다. 이는 주석 오류 해결이 모델 성능 향상에 기여함을 보여준다.
편향 분석: 인구통계학적 변수(연령, 인종, 성별)와 자살 위기 간 관계를 분석한 결과, 문제 인스턴스 제거 후 편향이 감소하는 것으로 나타났다.
이 연구는 사망 조사 기록의 주석 불일치 문제를 해결하고 자살 원인 분석의 정확성을 높이는 데 기여한다. 향후 연구에서는 자동화된 주석 오류 수정 방법을 개발하고 다양한 데이터 소스에 적용할 계획이다.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Song Wang,Yi... : arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19432.pdfDaha Derin Sorular