本論文は、大規模言語モデル(LLM)を用いて臨床試験の参加適格患者を自動的に特定する手法を提案している。
まず、LLMを用いて患者の診療記録から参加適格性を判断する「ゼロショット」アプローチを検討した。GPT-4を用いたシステムは、既存の最高性能モデルを6ポイントのマクロF1スコアと2ポイントのマイクロF1スコアで上回った。
次に、プロンプトの設計と2段階の検索パイプラインを工夫することで、コストと効率を大幅に改善した。プロンプトの最適化により、GPT-4を用いた場合、1人の患者の評価コストを約1.55ドルまで削減できた。一方、検索パイプラインにより、トークン数を3分の1まで削減しつつ高い性能を維持できた。
最後に、LLMが生成した根拠説明を医師が評価したところ、正しい判断に対しては97%が適切な説明であり、誤った判断に対しても75%が適切だと評価された。これにより、LLMベースのシステムが人間の監視の下で運用可能であることが示された。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Michael Worn... um arxiv.org 04-09-2024
https://arxiv.org/pdf/2402.05125.pdfTiefere Fragen