Kernekoncepter
本文比較了 UNET 和堆疊式 UNET 兩種基於卷積神經網路 (CNN) 的架構,利用 APTOS 資料集進行糖尿病視網膜病變 (DR) 的自動診斷,發現堆疊式 UNET 模型在驗證指標方面優於基礎模型,顯示出更複雜的模型在提高圖像分類準確性方面的優勢。
Resumé
論文資訊
- S. Navaneetha Krishnan, Ameya Uppina, Talluri Krishna Sai Teja, Nikhil N Iyer, Joe Dhanith P R. (2024). Enhancing Diabetic Retinopathy Detection with CNN-Based Models: A Comparative Study of UNET and Stacked UNET Architectures. Proceedings of ISETE International Conference, Bangalore, India, 25th September, 2024.
研究目標
本研究旨在比較 UNET 和堆疊式 UNET 兩種基於 CNN 的架構,評估其在使用 APTOS 資料集進行糖尿病視網膜病變自動診斷方面的性能。
方法
- 研究人員使用 APTOS 2019 資料集,其中包含 3,662 張來自印度農村參與者的視網膜圖像。
- 將圖像預處理為灰階並調整大小,並創建水平翻轉圖像以擴充資料集。
- 分別使用 UNET 和堆疊式 UNET 架構訓練兩個 CNN 模型。
- 評估模型在訓練和驗證集上的準確性、損失、AUC、精確率、召回率和 F1 分數等指標。
主要發現
- 兩種模型在檢測不同階段的糖尿病視網膜病變方面都表現出潛力,在視網膜圖像分類方面達到了顯著的準確性。
- UNET 模型的準確率為 92.81%,而堆疊式 UNET 模型的準確率為 93.92%,儘管存在資料集品質、圖像差異和類別不平衡等挑戰,但仍顯示出良好的性能。
- 堆疊式 UNET 憑藉其更深的架構表現出更高的性能,證明了更複雜的模型在提高圖像分類準確性方面的優勢。
主要結論
- 基於 CNN 的模型在糖尿病視網膜病變診斷中具有可行性。
- 堆疊式 UNET 架構通過更深入的層次結構和空間解析度改進,提高了診斷的準確性。
- 未來的工作應側重於解決資料集限制、應用資料增強技術和完善模型架構,以提高臨床應用的敏感性和泛化能力。
Statistik
UNET 模型的準確率為 92.81%。
堆疊式 UNET 模型的準確率為 93.92%。
全球約有 4.2 億人患有糖尿病。
預計三分之一的糖尿病患者會發展為糖尿病視網膜病變。
在美國,40% 的 II 型糖尿病患者和 86% 的 I 型糖尿病患者出現糖尿病視網膜病變的跡象。
中國農村地區的糖尿病視網膜病變發病率高達 43%。
印度的眼科醫生與患者比例為 1:10,000。
Citater
"These results highlight the feasibility of CNN-based models in DR diagnosis."
"The Stacked UNET, with its deeper architecture, showed improved performance, underscoring the benefits of more complex models for enhancing image classification accuracy."