Core Concepts
大規模言語モデルを用いた ensemble reasoning アプローチにより、癌ステージ判定の一貫性と正確性が向上する。
Abstract
本研究では、大規模言語モデルを用いて病理レポートから癌ステージを判定する際の課題に取り組んでいる。
まず、ゼロショット(ZS)、ゼロショットチェーン・オブ・シンキング(ZS-CoT)、ZS-CoTにセルフ一貫性(SC)を組み合わせた手法(ZS-CoT-SC)の3つのベースラインを検討した。
その上で、著者らが提案するEnsemble Reasoning (EnsReas)アプローチを開発した。EnsReasは、ZS-CoT-SCの出力を分析し、一貫性のある予測と一貫性のない予測を分類する。一貫性のない予測に対して、専門家パネルの議論を模したプロンプトを与えることで、より一貫性のある予測を得ることができる。
実験の結果、EnsReasはベースラインよりも予測性能と一貫性の両面で優れていることが示された。特に、ZS-CoT-SCで一貫性のない予測だった症例の多くが、EnsReasによって正解に修正されていた。
この成果は、大規模言語モデルを臨床現場で活用する際の信頼性と実用性を高める上で重要な知見となる。今後は、より広範な医療タスクへの適用や、医師のフィードバックを取り入れる仕組みの検討などが期待される。
Stats
乳がんの病理レポートデータセットを使用し、T因子とN因子の2つのタスクを検討した。
T因子のクラス分布: T1 589, T2 273, T3 131, T4 38
N因子のクラス分布: N0 316, N1 300, N2 110, N3 74
Quotes
"EnsReasは、ZS-CoT-SCの出力を分析し、一貫性のある予測と一貫性のない予測を分類する。一貫性のない予測に対して、専門家パネルの議論を模したプロンプトを与えることで、より一貫性のある予測を得ることができる。"
"実験の結果、EnsReasはベースラインよりも予測性能と一貫性の両面で優れていることが示された。特に、ZS-CoT-SCで一貫性のない予測だった症例の多くが、EnsReasによって正解に修正されていた。"