本研究では、物体検出器のマルチヘッド自己注意機構から関係情報を効果的に抽出するEGTRモデルを提案している。具体的には以下の3つの特徴がある:
物体検出器の自己注意層から得られる注意クエリと注意キーを、それぞれ主語と目的語として活用し、浅い関係抽出ヘッドで効率的にリレーション予測を行う。
物体検出性能に応じて関係ラベルを適応的に滑らかにする手法を提案し、物体検出とリレーション抽出の多タスク学習を効果的に行う。
主語と目的語の間に関係が存在するかを予測する接続性予測タスクを補助タスクとして導入し、関係抽出の表現学習を促進する。
これらの手法により、EGTRは少ないパラメータ数と高速な推論速度を維持しつつ、物体検出と関係抽出の両タスクで優れた性能を達成している。特に、物体検出性能が最高水準であり、関係抽出性能も既存手法と同等以上の水準を示している。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы