Centrala begrepp
再現性と堅牢性の概念を明確に定義し、新しい評価方法である「総合的な検索効率」を提案する。
Sammanfattning
この記事は再現性と堅牢性の概念を論じ、新しい評価方法である「総合的な検索効率」を提案しています。再現性は全ての関連アイテムを見つけたいユーザーに対する感度を示し、堅牢性は最も不利なユーザーに対する効果を測定します。記事では従来の平均効用主義から分配正義に基づく異なる伝統に焦点を当てています。これにより、システムのパフォーマンスが異なるユーザー集団間でどのように変化するかを理解できます。
Statistik
Fernando Diaz and Bhaskar Mitra. 2023. Recall, Robustness, and Lexicographic Evaluation. ACM Trans. Recomm. Syst. 1, 1, Article 4 (March 2023), 45 pages.
Extensive empirical analysis across three recommendation tasks and 17 information retrieval tasks.
Citat
"Recall is aligned with worst-case robustness."
"Total Search Efficiency is a family of metrics parameterized by a specific exposure function."