核心概念
大型語言模型 (LLM) 具有徹底改變醫療保健的潛力,本文提供了一個在醫學領域使用 LLM 的全面框架,涵蓋任務制定、模型選擇、提示工程、微調和部署等關鍵階段,幫助醫療保健專業人員在應對法規遵從、公平性和成本等挑戰的同時,最大限度地發揮 LLM 的優勢。
導言
大型語言模型 (LLM) ,例如 GPT-4、Claude 3、Gemini 1.5 和 Llama 3,展現出在各種醫療保健應用中的巨大潛力,例如臨床記錄、臨床試驗匹配和回答醫學問題。然而,目前缺乏將其應用從實驗室推廣到臨床實踐的實用、可操作指南。本文旨在通過提供一個詳細的結構化框架來彌合這一差距,以指導 LLM 在醫療工作流程中的利用和整合。
任務制定
將抽象的醫療需求轉化為一個或多個可以通過 LLM 解決的具體任務,需要使用者首先了解 LLM 的核心功能,我們將其分為五大類:(1) 知識和推理,(2) 摘要,(3) 翻譯,(4) 結構化,以及 (5) 多模態數據分析。
知識和推理: LLM 可以使用其參數中編碼的醫學知識,在給定不同上下文信息的情況下執行特定領域的推理。
摘要: LLM 可以將複雜的文檔總結為簡潔的段落或句子。
翻譯: LLM 還具有翻譯文本的能力,不僅可以在不同語言之間翻譯,還可以在適合不同受眾的寫作風格之間翻譯。
結構化: LLM 可用於將自由文本輸入轉換為結構化輸出,例如關鍵值對列表。
多模態: 像 GPT-4 這樣的多模態 LLM 可以分析和整合文本、圖像、音頻甚至基因組信息等多種類型的數據。
大型語言模型選擇
使用者應根據其任務特點選擇合適的 LLM。選擇 LLM 時,使用者應考慮三個關鍵因素:任務和數據、性能要求和模型接口。
任務和數據: 首先要考慮的是使用者正在處理的數據的性質以及要執行的特定任務。
性能要求: 模型的醫學能力是選擇 LLM 時要考慮的最關鍵因素之一。
模型接口: 選擇 LLM 後,使用者還需要根據自己的需求選擇訪問 LLM 的方式。
提示工程
要利用 LLM 的功能來完成特定任務,需要仔細考慮提供給模型的提示(輸入內容)。提示工程是指設計和優化提示,以有效地指導 LLM 生成準確且連貫的響應的過程。
少樣本學習 (FSL): 如圖 4a 所示,FSL 在提示中包含一些示例(即“樣本”),以便為模型更好地指定任務。
思維鏈 (CoT) 提示: 如圖 4c 所示,CoT 提示涉及設計提示,引導模型逐步進行推理過程。
檢索增強生成 (RAG): 在 RAG(圖 4d)中,搜索引擎會檢索相關文檔(例如科學文章)並將其包含在提示中,從而使模型能夠更好地解決知識密集型任務,例如回答問題。
工具學習: 某些醫學任務需要使用特定領域的工具,例如數據庫實用程序或醫學計算器。
設置溫度: 除了提示之外,LLM 還需要一個溫度參數,該參數控制生成響應時的隨機性程度。
微調
儘管 LLM 可以使用提示工程來解決許多任務,而無需顯式修改模型,但至少有三種情況可以考慮進行微調:(1) 提示工程技術(如少樣本學習和 RAG)無法充分改善結果,(2) 高質量的訓練數據很容易大量獲得,(3) 工作提示太長,在成本方面不可行。
部署注意事項
在生物醫學領域部署 LLM 需要遵守 HIPAA 和通用數據保護條例 (GDPR) 等隱私標準,以保護患者數據。
法規遵從: 使用專有 LLM 時,必須確保平台符合 HIPAA 規定。
公平與公正: 使用者應評估 LLM 訓練數據和算法中潛在的偏差,以確保公平公正的結果。
成本: 在考慮部署大型語言模型的成本時,區分專有模型和開源模型非常重要。
部署後: 在醫療保健中部署 LLM 後,持續監控至關重要。
結論
大型語言模型 (LLM) 具有通過增強臨床工作流程、決策和患者結果來徹底改變醫療保健的潛力。但是,要將其有效整合到醫療實踐中,需要一種系統且周到的方法。本教程提供了一個在醫學領域使用 LLM 的全面框架,強調了任務制定、模型選擇、提示工程和部署等關鍵階段。通過遵循這些指南,醫療保健專業人員可以在應對法規遵從、公平性和成本等挑戰的同時,最大限度地發揮 LLM 的優勢。隨著人工智能的持續發展,仔細應用這些方法對於確保負責任和有效地使用 LLM 至關重要,最終提高向患者提供的護理質量。
統計資料
建議收集約 100 個測試實例,以遵循醫學領域中 LLM 的若干評估研究。
一個詞彙大約等於 0.8 個單詞,因為文本通常被詞彙化為子詞和單個字符。
GPT-4(128k 個詞彙的上下文窗口)、Claude 3(200k 個詞彙)和 Gemini 1.5 Pro(1M 個詞彙)可以分別處理大約 320、800 和 2,500 篇 PubMed 文章。
對於一個包含大約 4,000 個詞彙的典型 MIMIC-III 出院記錄,處理成本約為 0.12 美元,具體取決於模型生成的響應長度。