Conceitos essenciais
開源の臨床用大規模言語モデルを使って、病理レポートからがんの病期情報を抽出できる。
Resumo
本研究では、がんの病期分類を行うために、開源の臨床用大規模言語モデルの性能を評価した。
- がんの病期分類は治療計画の重要な情報であるが、電子カルテの非構造化テキストデータから抽出するのは難しい
- 従来のNLPアプローチは大量の教師データが必要だったが、大規模言語モデルを使えば教師データなしでも性能が出せる可能性がある
- 実験では、一般用途の言語モデルLlama-2-70b-chatと、臨床用の言語モデルClinicalCamel-70BおよびMed42-70Bを使用
- 異なるプロンプト戦略(ゼロショット、ゼロショットチェーン思考、フューショット)を比較
- その結果、臨床用モデルはT分類では劣るものの、N分類とM分類では既存の教師データ学習モデルと同等以上の性能を示した
- 特にM分類では、Med42-70BがClinical-BigBirdを上回る性能を示した
- がんの種類別に見ると、Med42-70BがT、N、M分類のすべてでClinical-BigBirdを上回る性能を示した
- 開源の臨床用大規模言語モデルは教師データなしでも高い性能を発揮でき、臨床現場での活用が期待できる
Estatísticas
乳がん(BRCA)のT分類でMed42+ZS-COTは0.72のマクロF1スコアを達成した。
肺がん(LUAD)のN分類でMed42+ZS-COTは0.89のマクロF1スコアを達成した。