核心概念
通過識別和移除次優臨床決策,逆向增強學習可以更準確地揭示臨床決策中的優先級和價值觀,並揭示不同人群在醫療保健方面存在的差異。
摘要
運用逆向增強學習識別系統性次優醫療決策:修剪通往最佳護理的道路
本研究旨在利用逆向增強學習 (IRL) 從觀察性臨床數據中識別次優臨床決策,並探討其對不同人群的影響。
研究人員使用來自 MIMIC-IV 數據庫的低血壓和敗血症患者數據,構建了一個兩階段 IRL 模型。第一階段使用 MaxEnt IRL 算法從所有觀察到的臨床決策中學習獎勵函數。第二階段根據第一階段學習到的獎勵函數,識別並移除偏離共識決策的軌跡,然後使用剩餘數據重新訓練 IRL 模型。