本文基於開源的熱帶和傳染性疾病(TRINDs)數據集進行研究,並對其進行擴充,包括人口統計和語義臨床及消費者增強,生成了11,000多個提示。研究團隊評估了通用和醫療領域的大型語言模型在這些提示上的表現,並將其與人類專家的表現進行了比較。通過系統實驗,研究團隊證明了人口統計、位置、性別和風險因素等上下文信息對於獲得最佳大型語言模型響應非常重要。最後,研究團隊開發了一個名為TRINDs-LM的原型研究工具,可以探索上下文如何影響大型語言模型在健康領域的輸出。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor