核心概念
專家認知驅動的集成深度學習 (ECDEDL) 方法可以有效提高預測模型在外部驗證中的性能,使其在數值上接近內部驗證結果,為乳腺癌新輔助化療病理學完全缓解的預測提供更可靠的依據。
摘要
文獻資訊
Yang, Y., Li, F., Wei, Y., Zhao, Y., Fu, J., Xiao, X., & Bu, H. (2024). Experts’ Cognition-Driven Ensemble Deep Learning for External Validation of Predicting Pathological Complete Response to Neoadjuvant Chemotherapy from Histological Images in Breast Cancer. Medinformatics, 2024, 1-13.
研究目標
本研究旨在探討專家認知驅動的集成深度學習 (ECDEDL) 方法在預測乳腺癌新輔助化療病理學完全缓解 (pCR) 中的有效性,特別關注其在外部驗證中的表現。
方法
- 收集來自四個中心的 1035 張全切片圖像 (WSI),其中 695 張來自同一中心,用於模型開發和內部驗證,其餘 340 張來自其他三個中心,用於外部驗證。
- 邀請病理學專家在每張 WSI 上標記包含腫瘤和間質的代表性區域 (ROI),並從中裁剪出 233 × 233 μm 的小圖像(稱為“圖塊”)。
- 使用圖像分割工具從組織學圖像圖塊中提取腫瘤和間質內容,分別構建腫瘤數據集和間質數據集。
- 採用集成深度學習框架,分別使用 MobileNetV2、ResNet101V2 和 NASNetLarge 作為深度神經網絡 (DNN) 架構,並使用相同的學習策略對其進行訓練。
- 使用 ROC 和 PR 曲線評估預測模型的整體性能,並使用在概率閾值為 0.5 時計算的 Precision、Recall、F1 和 Accuracy 等指標評估其在實際應用中的性能。
主要發現
- 與基於原始數據訓練的模型相比,基於腫瘤數據集和間質數據集訓練的模型在外部數據上的表現更好,表明病理學專家的認知在 ECDEDL 中起著重要作用。
- 集成腫瘤模型和間質模型的 TS-Ensemble 模型在外部數據上的表現優於單獨的腫瘤模型和間質模型,表明人工智能專家的認知可以進一步提高模型的泛化能力。
- TS-Ensemble 模型在外部數據上的整體性能和實際應用性能均接近於直接模型在內部數據上的性能,表明 ECDEDL 方法可以有效提高預測模型在外部驗證中的性能,使其在數值上接近內部驗證結果。
主要結論
ECDEDL 方法是一種有效的外部驗證方法,可以提高基於深度學習的乳腺癌新輔助化療病理學完全缓解預測模型的性能。
研究意義
本研究提出了一種新的深度學習模型外部驗證方法,為解決醫學圖像分析中普遍存在的外部驗證性能下降問題提供了新的思路。
局限與未來研究方向
- 本研究中選擇的專家認知應具有廣泛的共識性,以避免個人偏見對模型的影響。
- 未來應進一步探索 ECDEDL 方法在不同癌症類型和成像模式中的泛化能力。
- 可以嘗試將 ECDEDL 方法與其他解決方案和聯邦學習相結合,以進一步提高模型的性能。
統計資料
本研究使用了 1035 張全切片圖像 (WSI),其中 695 張用於模型開發和內部驗證,340 張用於外部驗證。
在外部驗證中,ECDEDL 將 pCR 預測的 AUC 從 61.52 (59.80-63.26) 提高到 67.75 (66.74-68.80),將 pCR 預測的 Accuracy 從 56.09 (49.39-62.79) 提高到 71.01 (69.44-72.58)。
引述
"The out-of-distribution problem of external validation, i.e., the problem of domain generalization is the primary challenge for deep learning in breast cancer imaging."
"Usually, a pathological expert commonly will refer to his cognition, that has been accumulated via different working experiences, about the medical data at hand to make decisions."
"As far as we know, this paper is the first that has proposed an experts’ cognition-driven approach, which is particularly for addressing the out-of-distribution problem in external validation."