核心概念
本文探討了大型語言模型在熱帶和傳染性疾病分類任務上的表現,並分析了不同上下文因素對模型性能的影響。
要約
本文基於開源的熱帶和傳染性疾病(TRINDs)數據集進行研究,並對其進行擴充,包括人口統計和語義臨床及消費者增強,生成了11,000多個提示。研究團隊評估了通用和醫療領域的大型語言模型在這些提示上的表現,並將其與人類專家的表現進行了比較。通過系統實驗,研究團隊證明了人口統計、位置、性別和風險因素等上下文信息對於獲得最佳大型語言模型響應非常重要。最後,研究團隊開發了一個名為TRINDs-LM的原型研究工具,可以探索上下文如何影響大型語言模型在健康領域的輸出。
統計
全球有17億人受到被忽視的熱帶疾病的影響,其中大部分發生在發展中國家。
每年全球有超過5,200萬人死於傳染性疾病,99%發生在發展中國家。
在COVID-19大流行期間,已實施了各種可擴展的措施來應對這些挑戰,但其他熱帶和傳染性疾病的跟踪和準確診斷仍然有限。
引用
"忽視的熱帶疾病,雖然極其可預防和可治療,但仍然在世界上最貧窮的地區高度流行,影響全球17億人,對婦女和兒童的影響尤其嚴重。"
"半數世界人口面臨傳染病風險,這些疾病繼續導致全球超過5,200萬人死亡,其中99%發生在發展中國家。"