多腕バンディット問題において、貪欲アルゴリズムが効果的であることを示す。
本論文では、ヘビーテイルド多腕バンディット(HTMAB)問題に対する新たなアルゴリズム「uniINF」を提案し、確率的環境と敵対的環境の両方においてロバスト性と適応性を示しています。uniINFは、ヘビーテールのパラメータ(σ、α)の事前知識を必要とせずに、確率的環境と敵対的環境の両方でほぼ最適なリグレットを保証する、パラメータフリーかつBest-of-Both-Worlds(BoBW)特性を持つ初のアルゴリズムです。