本論文では、型指向型の名称エンティティ認識(NER)フレームワーク「ToNER」を提案している。ToNERは、生成言語モデルをベースとしつつ、以下の特徴を持つ:
入力文に最も関連性の高いエンティティ型を特定するための型マッチングモデルを導入している。これにより、生成モデルが注目すべきエンティティ型を絞り込むことができる。
エンコーダの学習に、エンティティ型の多重バイナリ分類タスクを追加することで、より適切な文表現を得ることができる。
エンティティ型の認識タスクを補助タスクとして導入し、生成モデルの性能をさらに向上させている。
実験の結果、ToNERは複数のベンチマークデータセットにおいて、既存手法と比べて優れた性能を示すことが確認された。特に、型マッチングモデルや補助タスクの導入が、ToNERの高精度化に寄与していることが明らかになった。
翻譯成其他語言
從原文內容
arxiv.org
深入探究