Core Concepts
大規模言語モデルを使用した新しいアプローチで、クロスドメインアプリケーションにおける社会的決定要因(SDoH)の抽出性能を向上させる。
Abstract
自然言語処理(NLP)と大規模言語モデル(LLMs)の進歩が患者情報抽出を改善。
エンコーダー専用GatorTronとデコーダー専用GatorTronGPTなど2種類のLLMアーキテクチャを評価。
プロントチューニングはクロスドメインアプリケーションで優れたパフォーマンスを達成。
LLMsのサイズ拡大により、性能が向上することが確認された。
導入
NLPは臨床ナラティブから患者情報を抽出する主要技術。
既存手法はクロスドメイン応用において限られた転移学習能力を持つことが明らかになっている。
方法
SDoH抽出に関連する2つのデータセットを使用して、LLMsのP-tuningフレームワークを評価。
エンコーダー専用およびデコーダー専用LLMsで実験結果が示されている。
結果
P-tuningモデルは従来のファインチューニングモデルよりも優れたパフォーマンスを示す。
デコーダー専用LLMsはエンコーダー専用LLMsよりも良好な結果を達成。
議論
従来手法では限られた転移学習能力があることが示唆されている。
P-tuningはクロスドメイン応用における優れた転移学習能力を持つことが示されている。
Stats
GatorTronGPTはF1スコアで最高値を記録:0.8378
Quotes
"自然言語処理(NLP)と大規模言語モデル(LLMs)の進歩が患者情報抽出を改善。"
"エンコーダー専用GatorTronとデコーダー専用GatorTronGPTなど2種類のLLMアーキテクチャを評価。"