核心概念
開源の臨床用大規模言語モデルを使って、病理レポートからがんの病期情報を抽出できる。
要約
本研究では、がんの病期分類を行うために、開源の臨床用大規模言語モデルの性能を評価した。
がんの病期分類は治療計画の重要な情報であるが、電子カルテの非構造化テキストデータから抽出するのは難しい
従来のNLPアプローチは大量の教師データが必要だったが、大規模言語モデルを使えば教師データなしでも性能が出せる可能性がある
実験では、一般用途の言語モデルLlama-2-70b-chatと、臨床用の言語モデルClinicalCamel-70BおよびMed42-70Bを使用
異なるプロンプト戦略(ゼロショット、ゼロショットチェーン思考、フューショット)を比較
その結果、臨床用モデルはT分類では劣るものの、N分類とM分類では既存の教師データ学習モデルと同等以上の性能を示した
特にM分類では、Med42-70BがClinical-BigBirdを上回る性能を示した
がんの種類別に見ると、Med42-70BがT、N、M分類のすべてでClinical-BigBirdを上回る性能を示した
開源の臨床用大規模言語モデルは教師データなしでも高い性能を発揮でき、臨床現場での活用が期待できる
統計
乳がん(BRCA)のT分類でMed42+ZS-COTは0.72のマクロF1スコアを達成した。
肺がん(LUAD)のN分類でMed42+ZS-COTは0.89のマクロF1スコアを達成した。