toplogo
Iniciar sesión

がんの病期分類を開源の臨床用大規模言語モデルで行う


Conceptos Básicos
開源の臨床用大規模言語モデルを使って、病理レポートからがんの病期情報を抽出できる。
Resumen

本研究では、がんの病期分類を行うために、開源の臨床用大規模言語モデルの性能を評価した。

  • がんの病期分類は治療計画の重要な情報であるが、電子カルテの非構造化テキストデータから抽出するのは難しい
  • 従来のNLPアプローチは大量の教師データが必要だったが、大規模言語モデルを使えば教師データなしでも性能が出せる可能性がある
  • 実験では、一般用途の言語モデルLlama-2-70b-chatと、臨床用の言語モデルClinicalCamel-70BおよびMed42-70Bを使用
  • 異なるプロンプト戦略(ゼロショット、ゼロショットチェーン思考、フューショット)を比較
  • その結果、臨床用モデルはT分類では劣るものの、N分類とM分類では既存の教師データ学習モデルと同等以上の性能を示した
  • 特にM分類では、Med42-70BがClinical-BigBirdを上回る性能を示した
  • がんの種類別に見ると、Med42-70BがT、N、M分類のすべてでClinical-BigBirdを上回る性能を示した
  • 開源の臨床用大規模言語モデルは教師データなしでも高い性能を発揮でき、臨床現場での活用が期待できる
edit_icon

Personalizar resumen

edit_icon

Reescribir con IA

edit_icon

Generar citas

translate_icon

Traducir fuente

visual_icon

Generar mapa mental

visit_icon

Ver fuente

Estadísticas
乳がん(BRCA)のT分類でMed42+ZS-COTは0.72のマクロF1スコアを達成した。 肺がん(LUAD)のN分類でMed42+ZS-COTは0.89のマクロF1スコアを達成した。
Citas
なし

Consultas más profundas

開源の臨床用大規模言語モデルの性能を更に向上させるためにはどのようなアプローチが考えられるか。

大規模言語モデルの性能を向上させるためには、以下のアプローチが考えられます: データの拡充: より多くの訓練データを使用してモデルをトレーニングすることで、性能を向上させることができます。特に、がんの病期分類に関連するデータをさらに収集し、モデルに提供することが重要です。 ドメイン特化: がんの病期分類に特化したトレーニングデータを使用してモデルを調整することで、特定の臨床タスクにおいてより高い性能を発揮させることができます。 プロンプティング戦略の最適化: モデルへの入力や指示の形式を最適化することで、モデルの性能を向上させることができます。適切なプロンプトを使用することで、モデルがタスクをより効果的に理解し、適切な予測を行うことが可能です。 モデルのファインチューニング: 特定の臨床タスクに適したモデルを選択し、適切にファインチューニングすることで、性能を向上させることができます。臨床用途に特化したモデルを使用することで、より適切な予測が可能となります。
0
star