本論文では、IryoNLPが開発したMedReAct'N'MedReFlex フレームワークについて説明する。このフレームワークは、4つの専門医療エージェント(MedReAct、MedReFlex、MedEval、MedFinalParser)を統合し、構造化されたアプローチで医療エラーの検出と修正を行う。
MedReActエージェントは、観察、分析、行動のサイクルを繰り返し、医療エラーの特定を試みる。MedReFlex エージェントは、状況を振り返り、代替戦略を提案する。MedEval エージェントは5人の評価者によって提案された修正案を評価し、MedFinalParser エージェントが最終的な出力を整形する。
このフレームワークは、ClinicalCorpと呼ばれる大規模な医療コーパスを活用し、Retrieval-Augmented Generation (RAG)アプローチを採用している。ClinicalCorpには、ガイドライン、教科書、StatPearls、MedWiki(医療関連のWikipediaデータ)が含まれる。
MEDIQA-CORR 2024の公式テストでは9位の成績を収めたが、その後の最適化実験により、検索トップkを50、再ランクトップkを20、平均評価スコアしきい値を3.8、最小評価スコアしきい値を3に設定することで大幅な性能向上を実現した。
翻譯成其他語言
從原文內容
arxiv.org
深入探究