核心概念
本稿では、従来手法の精度評価がバイアスのみに限定されていた最大平均推定問題において、新たにHAVERアルゴリズムを提案し、その平均二乗誤差を解析することで、従来手法よりも優れた性能を持つことを示した。
要約
HAVER: インスタンス依存の誤差限界を用いた最大平均推定とQ学習への応用
本論文では、K個の分布から得られたサンプルを用いて、最大の平均値を持つ分布を推定するのではなく、最大の平均値自体を推定する問題である最大平均推定(MME)問題を扱っています。この問題は、Q学習やモンテカルロ木探索などの様々な機械学習タスクにおいて発生します。
従来のアルゴリズムでは、バイアスのみに着目した性能解析が行われていましたが、本論文では、**HAVER(Head AVERaging)**と呼ばれる新しいアルゴリズムを提案し、その平均二乗誤差(MSE)を解析しています。
本研究の目的は、MSEを主要な評価指標として、MSEレートの観点から理想的な推定量を特徴付ける基準を確立し、従来手法の限界を克服し、より優れたMSEレートを実現する新しい推定量HAVERを提案することです。