本研究では、マルチメディアイベント引数抽出(EAE)タスクに取り組んでいる。従来のEAEメソッドは弱いアラインメント戦略やシンプルな分類モデルを使用しており、自然言語で記述されたイベントテンプレートの機能を活用していなかった。
提案手法のMMUTFは、テキストエンティティと視覚オブジェクトの候補構造を活用し、クエリ表現(引数ロール)を介してそれらを統一された潜在空間に接続する。最後に、これらの表現を使ってイベントテンプレートから抽出されたクエリと候補の照合を行う。
実験では、M2E2ベンチマークで提案手法の有効性を検証した。テキストEAEでは現行SOTAを7%F1上回り、マルチメディアEAEでも2番目に良いシステムを上回る結果を得た。さらに、FrameNetを活用したクロスオントロジートランスファー学習の有効性も示した。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Philipp Seeb... في arxiv.org 10-03-2024
https://arxiv.org/pdf/2406.12420.pdfاستفسارات أعمق