Core Concepts
ToNERは、事前学習された生成言語モデルをベースとし、エンティティ型の情報を活用することで、より正確な名称エンティティ認識を実現する。
Abstract
本論文では、型指向型の名称エンティティ認識(NER)フレームワーク「ToNER」を提案している。ToNERは、生成言語モデルをベースとしつつ、以下の特徴を持つ:
入力文に最も関連性の高いエンティティ型を特定するための型マッチングモデルを導入している。これにより、生成モデルが注目すべきエンティティ型を絞り込むことができる。
エンコーダの学習に、エンティティ型の多重バイナリ分類タスクを追加することで、より適切な文表現を得ることができる。
エンティティ型の認識タスクを補助タスクとして導入し、生成モデルの性能をさらに向上させている。
実験の結果、ToNERは複数のベンチマークデータセットにおいて、既存手法と比べて優れた性能を示すことが確認された。特に、型マッチングモデルや補助タスクの導入が、ToNERの高精度化に寄与していることが明らかになった。
Stats
入力文に含まれるエンティティ型は、事前に定義された型の中から最も関連性の高いものが選択される。
生成モデルの出力は、エンティティ型とスパンのペアのリストの形式をとる。
Quotes
"ToNERは、事前学習された生成言語モデルをベースとし、エンティティ型の情報を活用することで、より正確な名称エンティティ認識を実現する。"
"型マッチングモデルや補助タスクの導入が、ToNERの高精度化に寄与している。"