本論文では、クロスドキュメントのイベントセマンティクスを表現するための新しいX-AMRフレームワークを提案している。
まず、X-AMRの概要を説明する。X-AMRは従来のAMRを拡張したもので、文間・文書間のイベントとエンティティのリンクを捉えることができる。
次に、X-AMRアノテーションのためのインターフェースとワークフローを紹介する。アノテーターは、まずイベントトリガーのロールセットIDを特定し、次にその引数を段階的に特定していく。この際、引数ストアとモデルインザループを活用して、効率的なアノテーションを実現している。
さらに、提案手法の有効性を検証するため、既存のイベントコリファレンスデータセットであるECB+に対してX-AMRアノテーションを行った。アノテーション結果の分析から、ロールセットIDの予測精度が80%を超えるなど、モデルインザループアプローチの有効性が示された。
また、GPTを活用したクロスドキュメントの引数生成手法についても検討し、ロケーションや時間情報の生成では良好な結果が得られたものの、ロールセットIDや主体/対象の生成では課題が残ることが分かった。今後はモデルインザループとの統合により、さらなる性能向上が期待できる。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문