Core Concepts
本論文では、実世界の制約に適応した軽量な棄却メカニズムを提案し、その有効性を実証する。特に、再ランキング段階における棄却に焦点を当てている。
Abstract
本論文は、信頼できる情報検索システムの構築を目的としている。近年、ニューラル情報検索(NIR)は従来の発見的手法を大きく改善してきたが、依然として失敗が多く発生している。これは、使用されるモデルが必ずしも適切な文書を検索できないためである。
本研究では、この課題に取り組むため、実世界の制約に適応した軽量な棄却メカニズムを提案する。具体的には以下の3点を行っている:
黒箱シナリオにおける棄却戦略の評価プロトコルを提案し、その有効性を実証する。
単純かつ効果的な参照ベースの棄却メカニズムを提案する。これは、参照なしの発見的ヒューリスティックを大きく上回る性能を示す。
実験の完全な再現性と棄却メカニズムの幅広い適用を促進するため、オープンソースのコードとアーティファクトを公開する。
提案手法は、参照データセットさえ小さければ十分であり、計算コストもほとんどかからないことが示された。これにより、実用的な情報検索システムへの導入が容易になると期待される。
Stats
提案手法は、参照データセットが38サンプル平均で必要となる。
提案手法の計算時間は、関連スコア計算時間の1.2%程度である。