本研究では、オープンソースの大規模言語モデルLLaMA-2-13Bを用いて、外来患者-医師の対話から高品質な診療録を生成する手法を示した。
まず、MIMIC-IVの退院サマリーデータを用いた継続的事前学習を行った。次に、ACI-BENCHおよび合成対話-診療録データセットDIALOGUE-Gを用いて教師あり微調整を行った。さらに、AIからのフィードバックを用いた強化学習(RLAIF)、そして人間からのフィードバックを用いた強化学習(RLHF)を行った。
その結果、LLaMA-Clinicモデルは、医師が作成した診療録と同等の品質の診療録を生成できることが示された。医師による盲検評価では、LLaMA-Clinicの診療録の90.4%が「受け入れ可能」以上と評価された。特に「アセスメントと計画」の項目では、LLaMA-Clinicの方が医師作成の診療録よりも高い「実用性」の評価を得た。
本研究は、医療機関が保有する患者記録やドメイン専門知識を活用して、小規模なオープンソースの大規模言語モデルを専門家レベルの診療録生成に適応させられる可能性を示した。また、診療録生成タスクにおける重要な考慮事項も明らかにした。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania