이 연구는 국가폭력사망보고시스템(NVDRS) 데이터에서 발견되는 주석 불일치 문제를 다룬다. 주석 불일치는 자살 원인 분석의 정확성을 저해하므로 이를 해결하는 것이 중요하다.
연구진은 다음과 같은 접근법을 사용하였다:
주석 불일치 검증: 타 주와 대상 주의 데이터를 활용하여 주석 불일치를 확인하였다. 대상 주의 데이터를 훈련 데이터에 포함시킬 경우 대상 주의 성능은 향상되지만 타 주의 성능은 저하되는 것을 확인하였다. 이는 주석 불일치가 존재함을 시사한다.
문제 인스턴스 식별: 교차 검증 기반 접근법을 통해 주석 오류가 의심되는 인스턴스를 식별하였다. 오하이오 주의 경우 가족 관계 위기 14.8%, 신체 건강 위기 13.9%, 정신 건강 위기 1.5%의 인스턴스가 잠재적 오류로 확인되었다.
주석 일관성 검증: 식별된 문제 인스턴스를 제거하고 모델을 재학습한 결과, 타 주 테스트 세트의 평균 F1 점수가 3.85% 향상되었다. 이는 주석 오류 해결이 모델 성능 향상에 기여함을 보여준다.
편향 분석: 인구통계학적 변수(연령, 인종, 성별)와 자살 위기 간 관계를 분석한 결과, 문제 인스턴스 제거 후 편향이 감소하는 것으로 나타났다.
이 연구는 사망 조사 기록의 주석 불일치 문제를 해결하고 자살 원인 분석의 정확성을 높이는 데 기여한다. 향후 연구에서는 자동화된 주석 오류 수정 방법을 개발하고 다양한 데이터 소스에 적용할 계획이다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Song Wang,Yi... lúc arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19432.pdfYêu cầu sâu hơn