Core Concepts
結合圖像和患者敘述的多模式深度學習方法能有效提高皮膚病診斷的準確率。
研究背景
美國有近三分之一的人無法獲得初級保健服務,還有百分之四十的人為了避免醫療費用而延遲就醫,導致許多疾病未被診斷和治療。
人工智能的興起為自我診斷和疾病識別帶來了希望,但現有方法缺乏大規模患者數據庫和研究方法過時,導致研究僅限於少數疾病或模式。
研究方法
本研究結合圖像和文本信息,開發了一種新的多模式皮膚病分類數據集,涵蓋 26 種皮膚病類型,包括 3.7 萬張皮膚病圖像和相應的患者敘述。
針對圖像數據,研究人員採用了多種圖像模型,包括 VGG、ResNet、EfficientNet 和 Vision Transformer,並通過圖像增強、遷移學習和微調等技術優化模型性能。
針對文本數據,研究人員使用了三種先進的大型語言模型(Llama-7B、Falcon-7B、Mistral-7B),並採用低秩適配(LoRA)技術進行微調。
為了提高模型對文本數據的分類性能,研究人員提出了一種新的微調策略——選項鏈(Chain of Options),將複雜的推理任務分解為訓練階段的中间步骤。
最後,研究人員將圖像模型和大型語言模型結合起來,構建了一個端到端的皮膚病診斷系統。
研究結果
在新的圖像數據集上,ResNet-50 模型經過優化後,top-1 準確率達到 80.1%。
在文本數據集上,Llama-7B 模型結合選項鏈策略後,準確率達到 90% 以上。
結合圖像模型和大型語言模型後,該系統在診斷皮膚病方面達到了 91.2% 的準確率。
研究結論
本研究提出了一種新的多模式皮膚病診斷方法,結合了圖像和患者敘述信息,有效提高了診斷準確率。
研究結果表明,該方法在檢測多種皮膚病方面具有潛力,可以顯著提高皮膚病診斷的效率和準確性。
未來研究方向
擴展數據集,涵蓋更多皮膚病類型。
使用外部知識庫實現基於檢索的生成(RAG),以便按需檢索疾病信息。
開發應用程序,進行真實環境測試。
與智能手機集成,讓用戶可以拍攝皮膚病變圖像並接收即時反饋或建議。
Stats
美國有近三分之一的人無法獲得初級保健服務。
百分之四十的美國人為了避免醫療費用而延遲就醫。
該研究使用了一個包含 26 種皮膚病類型的新數據集,包括 3.7 萬張皮膚病圖像和相應的患者敘述。
ResNet-50 模型在新的圖像數據集上,top-1 準確率達到 80.1%。
Llama-7B 模型在文本數據集上,結合選項鏈策略後,準確率達到 90% 以上。
結合圖像模型和大型語言模型後,該系統在診斷皮膚病方面達到了 91.2% 的準確率。