MedCodER是一個三步驟的框架,用於自動進行國際疾病分類(ICD)編碼:
提取階段:使用大型語言模型(LLM)從醫療記錄中提取疾病診斷、支持證據文本和初步的ICD-10編碼。
檢索階段:利用語義搜索從ICD-10編碼庫中檢索與提取的疾病診斷相關的候選編碼。
重排階段:將提取和檢索得到的ICD-10編碼進行重排,生成最終的編碼預測。
與現有最先進方法相比,MedCodER在ICD-10編碼預測上取得了顯著的性能提升,微F1值達到0.60。同時,MedCodER的設計也使其具有可解釋性,可以提供編碼選擇的理由。此外,我們還創建了一個新的數據集,包含醫療記錄、疾病診斷、ICD編碼和支持證據文本的註釋,為開發和評估基於生成式人工智能的ICD編碼方法提供了支持。
翻譯成其他語言
從原文內容
arxiv.org
深入探究