本論文は、クロスドキュメントイベントコリファレンス解決(ECR)の課題に取り組んでいる。ECRは、複数のドキュメントにまたがって同一の実世界イベントを参照しているイベントメンションをグループ化する課題である。
現状のECRシステムは、イベントの引き金となる語彙的特徴(トリガー)の一致に過度に依存しており、文脈的な意味特徴(論理的根拠)を十分に捉えられていない。そこで本手法は、構造的因果モデルを用いてこの問題を分析し、大規模言語モデルを活用した反事実データ拡張手法を提案する。
具体的には、トリガーの多様な表現を生成して引き金の一致バイアスを緩和し(トリガー介入)、文脈的な意味特徴を強調する(文脈介入)ことで、ECRシステムの因果推論能力を高めている。
実験の結果、提案手法は3つの主要なベンチマークデータセットでState-of-the-Artの性能を達成し、ドメイン外データに対しても高い頑健性を示した。エラー分析からも、提案手法がイベントに関連する議論の理解を改善できることが確認された。
To Another Language
from source content
arxiv.org
Djupare frågor