核心概念
死亡調査記録の注釈不整合を検出し、自殺原因の誤帰属を明らかにする。
要約
本研究は、全米暴力死亡報告システム(NVDRS)の死亡調査記録における注釈の不整合を検出し、自殺原因の誤帰属を明らかにすることを目的としている。
まず、対象州のデータを訓練に加えると、対象州の予測精度が向上する一方で、他州の予測精度が低下することを示し、州間の注釈不整合の存在を実証した。次に、交差検証に似たアプローチを用いて、注釈の問題のある事例を特定した。オハイオ州では、家族関係危機の14.8%、身体的健康危機の13.9%、精神的健康危機の1.5%が潜在的な誤りと判断された。コロラド州では、それぞれ7.7%、4.9%、2.0%が潜在的な誤りと判断された。
これらの潜在的な誤りを除去すると、他州のテストセットの平均micro F1スコアが向上した。さらに、オハイオ州の家族関係危機の注釈について、2人の注釈者が89件の実際の誤りを特定し、修正したところ、他州のテストセットのスコアが4.2%、オハイオ州のテストセットのスコアが3.5%向上した。
最後に、人口統計学的サブグループ(年齢、人種、性別)の自殺関連状況と人口統計学的変数の関係を分析したところ、提案手法で特定した誤りを除去することで、バイアスリスクが低減されることが示された。
本研究は、NVDRS死亡調査記録の注釈不整合を明らかにし、自殺原因の誤帰属を解決するための重要な一歩を示した。これにより、自殺予防政策の立案や評価の精度が向上することが期待される。
統計
オハイオ州の家族関係危機の注釈の中で、159件(14.8%)が潜在的な誤りと判断された。
オハイオ州の身体的健康危機の注釈の中で、324件(13.9%)が潜在的な誤りと判断された。
オハイオ州の精神的健康危機の注釈の中で、143件(1.5%)が潜在的な誤りと判断された。
コロラド州の家族関係危機の注釈の中で、254件(7.7%)が潜在的な誤りと判断された。
コロラド州の身体的健康危機の注釈の中で、294件(4.9%)が潜在的な誤りと判断された。
コロラド州の精神的健康危機の注釈の中で、168件(2.0%)が潜在的な誤りと判断された。