Основные понятия
フランス語の医療分野の事前学習言語モデルを用いた臨床エンティティ認識タスクの包括的な評価を行い、モデルの性能と環境への影響を比較した。
Аннотация
本研究は、フランス語の医療分野の事前学習言語モデルを用いた臨床エンティティ認識タスクの包括的な評価を行った。3つの公開されたフランス語の臨床コーパスを使用し、一般的なフランス語モデルと医療分野特化モデルを比較した。
結果は以下の通り:
CamemBERT-bioモデルが最も良好なパフォーマンスを示した
FlauBERTモデルも競争力のある性能を発揮した
frALBERTモデルは最も低い炭素排出量を示した
これは、フランス語の医療エンティティ認識に関する初めての包括的なベンチマーク評価である。モデルの性能と環境への影響の両面から比較を行い、医療分野の自然言語処理における有用な知見を提供した。
Статистика
DEFT コーパスのF1スコアは0.76
E3Cコーパスのマイクロ平均F1スコアは0.52
MEDLINEコーパスのF1スコアは0.68
EMEAコーパスのF1スコアは0.69