核心概念
大規模言語モデルとハイブリッドNLPモデルは、医師のメモを高精度で処理するための主要な手法として浮上している。
要約
この研究では、大規模言語モデルとハイブリッドNLPモデルが、医師のメモを高精度でフェノタイピングすることが可能であることが示されています。これにより、精密医療における徴候や症状の高スループットフェノタイピングが実現可能になります。過去30年間で、高スループットフェニオタイピングへの進展がありました。一般的な大規模言語モデルは、医師のメモの深いフェニオタイピングにおいて好ましい手法として浮上する可能性があります。
精密医学では、診断、結果、治療、および疾患の分子メカニズムを個々の患者に正確にマッチングすることが重要です。精密医学の重要なコンポーネントは、適切なオントロジーから標準化された計算可能な用語を使用して疾患の徴候や症状を正確に記述することです。これらの徴候や症状の詳細な記述は深いフェニオタイピングと呼ばれています。
電子健康記録内の数千または数百万件もの医師メモから深いフェニオタイピングを行うためには、高スループット手法が必要です。高スループットフェニオタイピングは農業で進展してきましたが、人間医学での採用は遅れています。精密医学向けに電子健康記録の高スループットフェニオタイピング向けに改良された手法が必要です。
統計
大規模言語モデル(LLM)GPT-4は19種類の表現型カテゴリーへ自動的にマップします。
NimbleMinerおよびGPT-4ではそれぞれ0.87および0.85という高い正確性を示しました。
ヒトアナトレーターおよびNimbleMinerおよびGPT-4による地面真実ラベル探索パフォーマンスメトリクス:Accuracy, Precision, Recall, Specificity, F1
引用
"Large language models will likely emerge as the dominant method for the high throughput phenotyping of signs and symptoms in physician notes."
"General-purpose large language models are emerging that can perform difficult NLP tasks such as the phenotyping of physician notes without additional model training."
"These high levels of accuracy are impressive given that the level of agreement between human annotators reaches a ceiling at a κ ≈ 0.90."