核心概念
LLMを活用したチャットボットシステムを専門家の検証と修正を通じて改善し、患者や介護者の医療に関する情報ニーズに効果的に対応することができる。
要約
本研究では、眼科医療の文脈で大規模に展開されたLLMを活用した専門家支援型チャットボットシステムCataractBotの分析結果を報告する。318人の患者や介護者が1,992件のメッセージを送信し、7人の専門家によって91.71%の回答が検証された。
分析の結果、以下の知見が得られた:
- 医療に関する質問が物流に関する質問を大幅に上回った
- ハルシネーションはほとんど見られず、専門家が84.52%の医療回答を正確だと評価した
- 専門家による修正を通じてシステムのパフォーマンスが19.02%向上し、専門家の負担が軽減された
- 患者や介護者は手術前日に最も多くの質問をしたが、専門家は患者固有の質問を見落とすことが多かった
- 知識ベースの拡大に伴い、同じ質問に対する回答の重複や矛盾が見られた
これらの知見は、LLMを活用した専門家支援型チャットボットの設計に役立つ。
統計
患者や介護者は手術前日に最も多くの質問をした
専門家は医療回答の84.52%を正確だと評価した
専門家による修正を通じてシステムのパフォーマンスが19.02%向上した
引用
"LLMを活用したチャットボットシステムを専門家の検証と修正を通じて改善し、患者や介護者の医療に関する情報ニーズに効果的に対応することができる。"
"分析の結果、医療に関する質問が物流に関する質問を大幅に上回ったことが明らかになった。"
"専門家は患者固有の質問を見落とすことが多かった。"