Keskeiset käsitteet
情報検索モデルにおいて、ある文書がランキングされない理由を説明し、その文書のランキングを改善するための単語を特定する。
Tiivistelmä
本研究では、情報検索モデルの透明性を高めるための因果的説明フレームワークを提案している。従来の研究では、ある文書が関連文書として選択された理由や、ある文書がより関連文書として選択された理由などを説明することに焦点が当てられていた。しかし、ある文書が関連文書として選択されなかった理由を説明することは十分に検討されていなかった。
本研究では、ある文書のランキングを改善するために必要な単語を特定することで、その文書がランキングされなかった理由を説明する手法を提案している。最適化フレームワークを用いて、この問題に取り組んでいる。実験の結果、統計的モデル(BM25)や深層学習モデル(DRMM、DSSM、ColBERT)に対して、提案手法の有効性が示された。
Tilastot
文書にクエリ単語を追加することで、文書のランキングを平均して60%改善できた。
提案手法は、クエリ単語以外の新しい単語を平均11.14個追加していた。
提案手法で追加された単語の平均63%がクエリ単語ではなかった。