本論文では、生成型アドホック情報検索の評価に関する課題について検討している。
まず、生成型情報検索の定義と2つの基本的なアプローチ(検索後生成、生成後検索)を示した。生成型情報検索は、従来の文書ランキングではなく、関連情報を統合した生成テキストを直接出力することで、ユーザの複雑な情報ニーズを満たすことができる。これは、Broder (2002)の検索タスクの分類における新しい第4世代の検索システムに相当する。
次に、生成型情報検索におけるユーザモデルを提案した。ユーザの情報検索プロセスを4段階(問題定義、情報源選択、情報源相互作用、情報統合)に分け、それぞれに対応する評価目的(プロンプト、検索、基盤付け、提示)を定義した。ユーザモデルでは、ステートメントレベルとレスポンスレベルの2つの粒度で、一貫性、網羅性、正確性、明確性の5つの効用次元を考慮した。また、ユーザの閲覧モデルとしては、順次閲覧、減衰、飽和の3つの特性を持つモデルを提案した。
最後に、この評価フレームワークの具体的な実装方法について検討した。実験設定、ステートメントの分割、効用の評価(参照なし、参照あり)、効果度指標の計算などの手順を示した。従来の情報検索評価手法との違いや、最近提案された他の評価フレームワーク(SWAN、EXAM)との比較も行った。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor