핵심 개념
多粒度の証拠情報(段落レベルと文レベル)を活用することで、質問に対する正確な回答生成を実現する。
초록
本研究では、Open-domain Question Answering (ODQA)タスクにおいて、関連文脈を適切に見極め、不適切な文脈の影響を排除する手法を提案する。
具体的には以下の2つのアプローチを取る:
- 段落再ランキングと文レベルの分類を組み合わせた多粒度の証拠識別:
- 段落レベルでは、関連性の高い段落を特定する。
- 文レベルでは、各段落内の重要な文を識別する。
- これらの多粒度の証拠情報を活用することで、不適切な文脈の影響を排除し、正確な回答生成を実現する。
- 多タスク学習の副産物の活用:
- 段落再ランキングと文レベルの分類の結果を活用する。
- 段落再ランキングの結果を用いて、不適切な段落を効率的に除外する。
- 文レベルの分類結果から得られるアンカーベクトルを活用し、デコーダーの回答生成を効果的に誘導する。
実験の結果、提案手法であるMGFiDは、既存手法と比較して、Natural Questions (NQ)データセットで3.5%、TriviaQA (TQA)データセットで1.0%のExact Matchスコアの向上を示した。また、効率性の面でも、デコーダーに渡す段落数を大幅に削減できることを確認した。
통계
質問に対して関連性の高い段落は平均4.5個(NQ)、8.9個(TQA)存在する。
上位20個の段落のうち、関連性の高い段落の割合は87%(NQ)、86%(TQA)である。
인용구
"既存の手法では、答案スパンの有無や段落レベルの関連性のみでは不十分であり、複雑で混同を招く文章を識別する必要がある。"
"提案手法MGFiDは、段落レベルと文レベルの証拠を統合的に活用することで、既存手法よりも3.5%(NQ)、1.0%(TQA)高いExact Matchスコアを達成した。"