Regret-Untere Schranke für WSU-UX bei strategischen Experten mit Bandit-Feedback
Der WSU-UX-Algorithmus, der für das Online-Lernen mit strategischen Experten unter Bandit-Feedback entwickelt wurde, kann im schlimmsten Fall keine bessere Regret-Garantie als Ω(T^2/3) erreichen.