本研究では、8つの大規模言語モデルを4つの異なる臨床テキスト要約タスクに適応し、定量的評価と臨床医による評価を行った。
定量的評価では、統語的、意味的、概念的な自然言語処理メトリクスを用いて、モデルとアダプテーション手法の性能を比較した。臨床医による評価では、要約の完全性、正確性、簡潔性を評価した。その結果、最良のアダプテーション済みモデルは、医療専門家の要約と同等(45%)または優れている(36%)ことが示された。
さらに、安全性分析を行い、モデルと医療専門家の両者が抱える課題を明らかにした。具体的には、潜在的な医療上の危害と、生成された虚偽情報の種類を特定した。
本研究は、大規模言語モデルが臨床テキスト要約において医療専門家を上回ることを示しており、臨床ワークフローへの統合により、医療従事者の文書作成負担を軽減し、患者ケアに集中できるようになる可能性を示唆している。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Dave Van Vee... في arxiv.org 04-15-2024
https://arxiv.org/pdf/2309.07430.pdfاستفسارات أعمق