Core Concepts
大規模言語モデルを使用したがん患者の心不全リスク予測において、サブワード特徴は他の特徴エンコーディング戦略よりも優れた性能を示す。
Abstract
この研究では、大規模な言語モデル(LLMs)を使用して、電子健康記録(EHRs)からがん患者の心不全(HF)リスクを特定する方法に焦点を当てています。
研究は、12,806人のがん患者コホートから1,602人のHF発症例と11,204人の非ケースを同定しました。
GatorTron-3.9Bモデルは、伝統的なサポートベクターマシンよりも39%、T-LSTMよりも7%、BERTよりも5.6%優れたF1スコアを達成しました。
サブワード特徴は、他の特徴エンコーディング戦略と比較して顕著に特徴密度を増加させました。
方法:
データソース:UF Health Integrated Data RepositoryからICD-9およびICD-10コードで肺がん、乳がん、結腸がん患者を同定。
機械学習モデル:XGBoostやSVMなどの伝統的なMLモデル、LSTMやBERTなどの深層学習モデル、GatorTronなどのLLMを探索。
評価:AUCや精度などの評価メトリックで比較。GatorTron-3.9Bが最高F1スコアを達成。
結果:
GatorTron-3.9Bは最高F1スコアであり、他のMLおよび深層学習モデルよりも優れたパフォーマンスを示しました。
さらにサブグループ分析では、GatorTron-3.9Bが多発性がん患者で最高性能を達成。
Stats
LLMsは多くのAIタスクで高度な能力を示すことが示されています。
Quotes
"Subword features remarkably increased feature density and improved performance."
"GatorTron models with subword features outperformed traditional machine learning models."