Alapfogalmak
本研究では、テキストと視覚の両方のモダリティからイベント引数を抽出するための統一テンプレート充填フレームワークを提案する。このアプローチにより、クロスオントロジートランスファーと、イベント固有のセマンティクスの活用が可能になる。
Kivonat
本研究では、マルチメディアイベント引数抽出(EAE)タスクに取り組んでいる。従来のEAEメソッドは弱いアラインメント戦略やシンプルな分類モデルを使用しており、自然言語で記述されたイベントテンプレートの機能を活用していなかった。
提案手法のMMUTFは、テキストエンティティと視覚オブジェクトの候補構造を活用し、クエリ表現(引数ロール)を介してそれらを統一された潜在空間に接続する。最後に、これらの表現を使ってイベントテンプレートから抽出されたクエリと候補の照合を行う。
実験では、M2E2ベンチマークで提案手法の有効性を検証した。テキストEAEでは現行SOTAを7%F1上回り、マルチメディアEAEでも2番目に良いシステムを上回る結果を得た。さらに、FrameNetを活用したクロスオントロジートランスファー学習の有効性も示した。
Statisztikák
国際移住機関は、ニジェールとリビアの国境を昨年250万人以上の移民が渡ったと推定している。
EUはすでに5つの移民センターを設置している。
Idézetek
「マルチメディアイベント抽出は、単一のモダリティに焦点を当てた従来の手法では不完全な理解しかできない」
「現行のマルチメディアEAEモデルは単純な分類手法に基づいており、クロスオントロジートランスファー機能やイベントテンプレートのセマンティクスを活用していない」