Zaloguj się

spostrzeżenie - 医療情報処理 - # がんの病期分類

がんの病期分類を開源の臨床用大規模言語モデルで行う

Główne pojęcia

開源の臨床用大規模言語モデルを使って、病理レポートからがんの病期情報を抽出できる。

Streszczenie

本研究では、がんの病期分類を行うために、開源の臨床用大規模言語モデルの性能を評価した。

がんの病期分類は治療計画の重要な情報であるが、電子カルテの非構造化テキストデータから抽出するのは難しい
従来のNLPアプローチは大量の教師データが必要だったが、大規模言語モデルを使えば教師データなしでも性能が出せる可能性がある
実験では、一般用途の言語モデルLlama-2-70b-chatと、臨床用の言語モデルClinicalCamel-70BおよびMed42-70Bを使用
異なるプロンプト戦略(ゼロショット、ゼロショットチェーン思考、フューショット)を比較
その結果、臨床用モデルはT分類では劣るものの、N分類とM分類では既存の教師データ学習モデルと同等以上の性能を示した
特にM分類では、Med42-70BがClinical-BigBirdを上回る性能を示した
がんの種類別に見ると、Med42-70BがT、N、M分類のすべてでClinical-BigBirdを上回る性能を示した
開源の臨床用大規模言語モデルは教師データなしでも高い性能を発揮でき、臨床現場での活用が期待できる

Customize Summary

Rewrite with AI

Generate Citations

Translate Source

To Another Language

Generate MindMap

from source content

Visit Source

arxiv.org

Statystyki

乳がん(BRCA)のT分類でMed42+ZS-COTは0.72のマクロF1スコアを達成した。
肺がん(LUAD)のN分類でMed42+ZS-COTは0.89のマクロF1スコアを達成した。

Cytaty

なし

Kluczowe wnioski z

Classifying Cancer Stage with Open-Source Clinical Large Language Models

by Chia-Hsuan C... o arxiv.org 04-03-2024

https://arxiv.org/pdf/2404.01589.pdf

Classifying Cancer Stage with Open-Source Clinical Large Language Models

Głębsze pytania

開源の臨床用大規模言語モデルの性能を更に向上させるためにはどのようなアプローチが考えられるか。

大規模言語モデルの性能を向上させるためには、以下のアプローチが考えられます：

データの拡充: より多くの訓練データを使用してモデルをトレーニングすることで、性能を向上させることができます。特に、がんの病期分類に関連するデータをさらに収集し、モデルに提供することが重要です。

ドメイン特化: がんの病期分類に特化したトレーニングデータを使用してモデルを調整することで、特定の臨床タスクにおいてより高い性能を発揮させることができます。

プロンプティング戦略の最適化: モデルへの入力や指示の形式を最適化することで、モデルの性能を向上させることができます。適切なプロンプトを使用することで、モデルがタスクをより効果的に理解し、適切な予測を行うことが可能です。

モデルのファインチューニング: 特定の臨床タスクに適したモデルを選択し、適切にファインチューニングすることで、性能を向上させることができます。臨床用途に特化したモデルを使用することで、より適切な予測が可能となります。

0

Spis treści

がんの病期分類を開源の臨床用大規模言語モデルで行う

Classifying Cancer Stage with Open-Source Clinical Large Language Models

開源の臨床用大規模言語モデルの性能を更に向上させるためにはどのようなアプローチが考えられるか。

Narzędzia i zasoby

Pobierz podsumowanie PDF w kilka sekund

Uzyskaj dokładne podsumowanie i kluczowe informacje dzięki funkcji Streszczenie PDF AI

O nas

Produkty | Zasoby

Spostrzeżenia

© 2024 by Linnk AI