本研究では、テキストと視覚の両方のモダリティからイベント引数を抽出するための統一テンプレート充填フレームワークを提案する。このアプローチにより、クロスオントロジートランスファーと、イベント固有のセマンティクスの活用が可能になる。