toplogo
登入

利用遷移學習和多示例學習實現對 H&E 全玻片圖像的 HER2 自動評分


核心概念
利用遷移學習,特別是從類似染色 (H&E 到 H&E) 的數據集進行遷移,結合多示例學習,可以在有限的玻片級標註數據下,實現對 H&E 全玻片圖像中 HER2 表達的自動評分,並具有良好的準確性。
摘要

研究論文摘要

書目信息

Abdulsadig, R. S., Williams, B. M., & Burlutskiy, N. (2024). Leveraging Transfer Learning and Multiple Instance Learning for HER2 Automatic Scoring of H&E Whole Slide Images. Proceedings of Machine Learning Research, 1–8. arXiv:2411.05028v1 [cs.CV]

研究目標

本研究旨在探討遷移學習對基於深度學習模型的 HER2 自動評分性能的影響,特別是比較從免疫組織化學 (IHC) 圖像、H&E 圖像和非醫學圖像進行遷移學習的效果。

方法

研究採用了多示例學習 (MIL) 框架,並結合注意力機制。研究人員使用在 ImageNet、PatchCamelyon 和 IHC HER2 數據集上預先訓練的 AlexNet 模型作為特徵提取模型,並將其應用於 HER2 評分競賽數據集的 H&E 全玻片圖像。

主要發現

研究發現,在 H&E 圖像上進行預訓練的嵌入模型始終優於其他模型,在 4 個 HER2 評分中平均 AUC-ROC 值為 0.622(每個 HER2 評分的範圍為 0.59 至 0.80)。此外,研究還發現,使用帶有注意力層的多示例學習不僅可以實現良好的分類結果,還可以通過利用逐塊注意力權重,在 H&E 玻片圖像中生成 HER2 陽性區域的可視化指示。

主要結論

遷移學習,特別是從類似染色 (H&E 到 H&E) 的數據集進行遷移,可以顯著提高 HER2 自動評分模型的性能。多示例學習為僅有有限玻片級標註數據的情況提供了一種有效的解決方案。

意義

這項研究為開發經濟高效的自動化 HER2 評分方法提供了有價值的見解,這有可能減輕病理學家的工作量並改善乳腺癌患者的診斷和治療。

局限性和未來研究方向

未来的研究可以集中於優化模型和探索 MIL 流程的微調策略,以進一步提高性能,並更好地理解不同數據集之間遷移學習的貢獻。此外,還可以進一步研究注意力機制在識別和可視化 HER2 陽性區域方面的作用。

edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

統計資料
在 4 個 HER2 評分中,使用 PatchCamelyon 數據集預訓練的模型平均 AUC-ROC 值為 0.622(每個 HER2 評分的範圍為 0.59 至 0.80)。 研究使用了 44 張玻片進行訓練,8 張玻片進行測試。 訓練過程中,每個 epoch 使用 6,400 個圖像塊組成的袋進行訓練,並使用 2,500 個袋進行驗證。 測試時,每個模型使用來自測試玻片的 2,500 個袋進行測試。
引述

深入探究

除了遷移學習和多示例學習之外,還有哪些其他機器學習技術可以用於提高 HER2 自動評分的準確性和效率?

除了遷移學習和多示例學習之外,以下機器學習技術也可用於提高 HER2 自動評分的準確性和效率: 主動學習 (Active Learning): 主動學習可以幫助解決標註數據缺乏的問題。該技術會主動選擇最具信息量的樣本進行標註,從而最大限度地提高模型的訓練效率。在 HER2 自動評分中,主動學習可以識別出模型最不確定的區域,並請求病理學家對這些區域進行標註,進而提高模型的準確性。 聯邦學習 (Federated Learning): 醫學影像數據的隱私和安全問題日益受到關注。聯邦學習允許在不共享數據的情況下,利用多個機構的數據訓練模型,從而保護患者隱私。這對於 HER2 自動評分非常重要,因為它可以匯集來自不同醫院的數據,而無需共享敏感的患者信息。 弱監督學習 (Weakly Supervised Learning): 弱監督學習可以使用較弱的標註信息(例如,圖像級別的標註)來訓練模型,而不需要像素級別的標註。這可以大大減少標註成本和時間。在 HER2 自動評分中,可以使用弱監督學習來訓練模型,僅使用包含 HER2 陽性細胞的圖像,而不需要精確標註每個細胞。 注意力機制 (Attention Mechanism): 注意力機制可以幫助模型關注圖像中最相關的區域,從而提高模型的準確性和可解釋性。在 HER2 自動評分中,注意力機制可以幫助模型關注那些可能包含 HER2 陽性細胞的區域,例如細胞膜。 生成對抗網絡 (Generative Adversarial Networks, GANs): GANs 可以生成逼真的醫學影像數據,可以用於數據增廣,從而提高模型的泛化能力。在 HER2 自動評分中,可以使用 GANs 生成更多樣化的訓練數據,例如不同染色程度、不同切片角度的圖像。

如果訓練數據集的大小和質量有限,如何確保 HER2 自動評分模型的泛化能力和可靠性?

在訓練數據集有限的情況下,可以採取以下措施來確保 HER2 自動評分模型的泛化能力和可靠性: 數據增廣 (Data Augmentation): 通過對現有數據進行旋轉、翻轉、裁剪、顏色變換等操作,可以生成更多的訓練樣本,增加數據的多樣性,提高模型的泛化能力。 遷移學習 (Transfer Learning): 使用在 ImageNet 等大型數據集上預訓練的模型,可以將學到的通用圖像特徵遷移到 HER2 自動評分任務中,即使訓練數據有限,也能獲得較好的性能。 正則化技術 (Regularization Techniques): 使用 L1、L2 正則化、dropout 等技術可以限制模型的複雜度,防止過擬合,提高模型的泛化能力。 集成學習 (Ensemble Learning): 訓練多個模型,並將它們的預測結果進行組合,可以降低單個模型的偏差和方差,提高模型的穩定性和可靠性。 模型校準 (Model Calibration): 使用 Platt 校準、isotonic 回歸等方法可以校準模型的預測概率,使其更接近真實的概率分佈,提高模型的可靠性。 嚴格的模型評估 (Rigorous Model Evaluation): 使用交叉驗證、留出法等方法對模型進行嚴格的評估,確保模型的性能在不同數據集上保持穩定。

這項研究的成果如何應用於其他類型的癌症或疾病的自動化診斷和評估?

這項研究的成果可以應用於其他類型的癌症或疾病的自動化診斷和評估,主要體現在以下幾個方面: 方法的遷移性 (Transferability of Methods): 這項研究中使用的遷移學習和多示例學習方法可以應用於其他類型的醫學影像分析任務,例如肺癌、皮膚癌等的自動化診斷。 模型的泛化能力 (Generalizability of Models): 通過使用適當的數據增廣、正則化技術和模型評估方法,可以提高模型的泛化能力,使其能夠應用於不同類型的癌症或疾病。 數據處理流程的借鑒 (Inspiration for Data Processing Pipelines): 這項研究中使用的數據處理流程,例如圖像預處理、特徵提取、模型訓練和評估等步驟,可以為其他醫學影像分析任務提供借鑒。 總之,這項研究為基於 H&E 染色圖像的 HER2 自動評分提供了一種有效的方法,並為其他醫學影像分析任務提供了有價值的參考。隨著深度學習技術的發展和醫學影像數據的積累,自動化診斷和評估將在未來發揮越來越重要的作用。
0
star