Core Concepts
機械学習を使用して、結核治療のアウトカムを正確に予測する方法を探る。
Abstract
カルナータカ州でのTB通知数は25,37,235件であり、公的部門と私的部門合わせて16,99,119件と8,38,161件が報告された。
患者データからリスクスコアを生成し、モデルはバリデーションセットで98%の再現率と0.95のAUC-ROCスコアを達成。
深層XGBoostツリーを使用してエンコーディング技術を適用し、CatBoostエンコーディングが最も効果的であることが示された。
パッシブ評価セットでXGBoostモデルはRecall@20が0.982、AvRecall(10,40)が0.977であり、平均アンサンブルモデルはRecall@20が0.988、AvRecall(10,40)が0.973であった。
Stats
モデルはバリデーションセットで98%の再現率と0.95のAUC-ROCスコアを達成。
XGBoostモデルはパッシブ評価セットでRecall@20が0.982、AvRecall(10,40)が0.977。
CatBoostエンコーディングが最も効果的であることが示された。