Core Concepts
医療分野におけるフェューショット名称エンティティ認識の課題を明らかにし、言語モデルの性能を評価し、さらなる性能向上に向けた新しい手法を提案する。
Abstract
本論文は、医療分野におけるフェューショット名称エンティティ認識の課題に取り組んでいる。まず、16種類の言語モデルを2つの医療データセットで評価し、大規模言語モデル(LLM)が小規模言語モデル(SLM)よりも優れた性能を示すことを明らかにした。しかし、LLMでも100%の正解率を達成するのは難しいことが分かった。
その理由として以下が挙げられる:
エンティティの抽出に失敗する
エンティティを誤認識する
クラスの衝突が発生する
1つのエンティティに複数のラベルが付与されている
特殊記号の生成に失敗する
出力テンプレートを正しく予測できない
これらの課題に対処するため、本研究では新しい手法「RT(Retrieving and Thinking)」を提案した。RTは、関連する事例の検索と段階的な推論プロセスを組み合わせることで、LLMの性能を向上させる。実験の結果、RTはベースラインよりも優れた性能を示した。
Stats
医療分野のフェューショット名称エンティティ認識では、長い特殊なエンティティや未知語のエンティティの抽出が困難である。
一部のエンティティには複数のラベルが付与されており、これが100%の正解率を阻害している。
Quotes
"LLMsは、適切な指示と合理的な抽出ロジックがあれば、医療分野のフェューショット名称エンティティ抽出に優れている。"
"LLMsは、エンティティの抽出に100%の正解率を達成するのは難しい。誤認識、誤ったテンプレート予測などの課題がある。"