Core Concepts
EVILLは、構造化された確率的バンディット問題のランダムな探索手法であり、PHEと同等の性能を提供します。
Abstract
EVILLは、線形に摂動された損失関数を最小化することで楽観的なモデルを生成し、効果的なランダム探索手法を提供します。PHEと比較して、データ依存型の摂動がパフォーマンス向上に寄与しました。Rayleighバンディット問題では、PHEが一貫性のない推定値と線形後悔をもたらす一方、EVILLは一貫性がありパフォーマンスが良好でした。
Stats
EVILLはTSLよりも優れている。
データ依存型の摂動はパフォーマンス向上に寄与する。
PHEは非一貫性の推定値と線形後悔を引き起こす可能性がある。
Quotes
EVILLはランダム探索手法として有望です。
PHEは特定のバンディット問題で不正確な推定値を導く可能性があります。