核心概念
大型語言模型 (LLM),特別是 LLAMA 架構,在增強 ICD 編碼分類方面具有巨大潛力,可通過直接分類和增強 MultiResCNN 框架中的文本表示來實現。
摘要
大型語言模型在醫學資訊學中的應用:直接分類和增強文本表示用於自動 ICD 編碼
本研究旨在探討大型語言模型 (LLM),特別是 LLAMA 架構,在自動 ICD 編碼方面的應用。研究重點在於評估 LLAMA 模型作為直接分類器以及用於生成增強文本表示以提升 MultiResCNN 框架性能的兩種方法。
研究使用了 MIMIC-III 數據庫,其中包含約 40,000 名患者的「出院摘要」。研究評估了 LLAMA 模型在兩種應用場景下的表現:
LLM 作為分類器 (LLAMA2-C): 對 LLAMA 模型進行微調,使其作為一個序列分類器,直接預測 ICD 代碼。
LLM 作為文本表示生成器 (LLAMA2-R+MRCNN): 使用 LLAMA 模型生成豐富的文本表示,並將其輸入 MultiResCNN 模型進行分類。
研究比較了 LLAMA 模型與其他基準模型(包括 MultiResCNN、DR-CAML、KG-MultiResCNN、XR-LAT-BootstrapHyperC 和 TransICD)的性能。評估指標包括 AUC、F1 分數和不同閾值下的精確率 (P@5、P@8 和 P@15)。