ZODIAC是一個基於大型語言模型(LLM)的多智能體框架,旨在實現心臟病專家級的診斷能力,協助心臟病專家從患者數據中提取臨床相關特徵、檢測重要心律失常,並生成初步診斷報告供專家審閱和完善。
當醫生和人工智能在診斷上存在分歧時,人工智能的可解釋性會影響醫生如何歸因分歧的來源,從而影響醫生是否改變自己的診斷。讓人工智能變得不可解釋反而可以增強其說服力,尤其是當醫生的異常檢測能力較弱時。此外,讓人工智能變得不可解釋也可以在醫生有職業考量時提高診斷的準確性。
本文提出了 MedQA-CS 基準測試框架,以評估大型語言模型在模擬真實臨床情境中的臨床技能表現。與傳統的多選題測試不同,MedQA-CS 採用指令跟隨任務設計,更全面地反映了醫生在診療過程中所需的實際技能。
本研究提出了FMBench,這是第一個專門設計用於評估醫療多模態大型語言模型(MLLM)公平性的基準測試。FMBench包含四個人口統計屬性,涵蓋十個群組,並包含30,000個用於視覺問答(VQA)評估的圖像-問答對和10,000個用於報告生成(RG)的圖像-報告對。此外,我們提出了一個新的指標公平性感知性能(FAP),以評估MLLM在不同人口統計群組中的公平性表現。我們對8個最先進的開源MLLM進行了全面評估,結果表明現有MLLM在醫療多模態任務中存在不公平性。
人工智能和物聯網醫療設備的整合大大推進了慢性和末期疾病的預測和診斷。基於機器學習和深度學習的模型在預測心臟病、慢性腎病、阿爾茨海默病和肺癌等疾病方面取得了顯著的準確性,達到98%以上的水平,這些模型依賴於來自Kaggle、UCI等公共平台以及私人醫療機構和實時物聯網醫療設備的數據。
GMAI-MMBench是一個全面的多模態評估基準,旨在全面評估大型視覺語言模型在醫療領域的能力,包括涵蓋38種醫療影像模態、18種臨床任務和18個臨床科室,以及4種感知粒度。
我們提出了一個新穎的疾病問答系統,能夠有效地利用知識圖譜和大型語言模型技術,通過聯合推理方法生成準確、易於理解的答案,以滿足普通用戶的需求。
本研究提出了Lab-AI系統,利用檢索增強型語言模型從可靠的健康資源中提供個人化的實驗室檢查正常範圍,以增強患者對檢查結果的理解。
人工智能技術在醫療領域的快速發展,同時也帶來了一系列安全隱患,需要謹慎應對。
數字孿生技術可以通過整合多種數據源和臨床指南,為癌症診療提供精準、個性化的決策支持,提高工作流效率。