核心概念
手順テキストの順序を活用することで、手順の中で変化する属性を持つエンティティの追跡を改善できる。
要約
本研究では、手順テキストの理解を強化するための新しい前処理手法を提案している。手順テキストは、タスクを完了するための順序付きの手順で構成されており、文脈内のエンティティの属性が変化するため理解が困難である。
提案手法では、レシピを例として取り上げ、手順の順序を監視信号として活用する。具体的には、順列分類、埋め込み回帰、Skip-Clipの3つの新しい前処理手法を導入し、比較している。
これらの手法は、レシピドメインのNPN-Cookingデータセットと汎用ドメインのProParaデータセットの2つのエンティティ追跡タスクにおいて、ベースラインや最先端の言語モデルよりも優れた性能を示している。特に、順列分類手法は、ProParaデータセットの平均カテゴリ精度で9%の改善を達成している。
このように、手順の順序を活用した前処理手法は、手順テキストの理解を向上させることが示された。
統計
手順テキストの理解は、文脈内のエンティティの属性変化が難しいため困難である。
レシピは一般的に順序付きの手順で表現されるため、この順序を監視信号として活用することで、エンティティの状態変化を予測する非自明なタスクの性能を向上できる。