核心概念
整合歷史病患報告,特別是最近的報告,可以顯著提高胸部X光片異常檢測的準確性。
摘要
書目資訊
Huang, H., Deniz, C.M., Cho, K., Chopra, S., & Madaan, D. (2024). HIST-AID: Leveraging Historical Patient Reports for Enhanced Multi-Modal Automatic Diagnosis. Proceedings of Machine Learning Research, 259, 1–15.
研究目標
本研究旨在探討如何利用歷史病患資料,包括放射影像和報告,來提高胸部X光片自動診斷的準確性。
方法
研究人員創建了一個名為 Temporal MIMIC 的資料集,該資料集整合了來自 MIMIC-CXR 的胸部 X 光片和來自 MIMIC-IV 的放射學報告,涵蓋了五年期間的病患資料。他們提出了一個名為 HIST-AID 的多模態框架,該框架使用基於 Transformer 的影像和文字時間序列編碼器來分別處理歷史影像和報告,並透過多模態融合將其結合起來進行診斷。
主要發現
- 與僅使用當前掃描影像的模型相比,整合歷史放射學報告顯著提高了所有十三種病症的自動異常檢測準確性,平均 AUROC 提高了 6.56%,AUPRC 提高了 9.51%。
- 這種改進在不同性別、年齡和種族群體中是一致的,表明該方法有助於減少診斷偏差。
- 最近的報告(診斷前 30 天內)對模型性能的影響最大,而較舊的報告往往會降低預測性能。
主要結論
整合歷史病患報告,特別是最近的報告,可以顯著提高胸部X光片異常檢測的準確性,並有助於實現更公平的診斷方法。
研究意義
這項研究強調了在醫學影像診斷中利用縱向病患資料的潛力,並為開發更準確、公平和可靠的自動診斷工具提供了有價值的見解。
局限性和未來研究方向
- 歷史放射影像對模型性能的影響有限,可能是由於與報告存在資訊重疊。未來研究可以探索更有效的方法來整合歷史影像和報告。
- 不同報告部分對模型性能的貢獻不同。需要進一步研究以確定如何有效地利用報告的所有部分,同時最大程度地減少計算成本。
統計資料
與僅使用當前掃描影像的模型相比,整合歷史放射學報告後,所有病症的平均 AUROC 提高了 6.56%,AUPRC 提高了 9.51%。
在不同性別、年齡和種族群體中,模型性能的提升是一致的。
最近的報告(診斷前 30 天內)對模型性能的影響最大,而較舊的報告往往會降低預測性能。
引述
"Our evaluation shows that integrating past reports improves model performance across thirteen pathologies, with average AUROC and AUPRC increases of 6.56% and 9.51% compared to current scan only methods."
"This improvement is consistent across subgroups defined by gender, age, and race, ensuring a more equitable diagnostic approach."
"We showed that the impact of historical data varies across time, with the most recent reports – upto 30 days from diagnosis – being valuable, while older records tend to diminish predictive performance."