Optimistische Online-Mirror-Descent-Methode zur Überbrückung von stochastischer und adversarieller Online-Konvexer-Optimierung
Die Arbeit untersucht die theoretischen Garantien der optimistischen Online-Mirror-Descent-Methode (Optimistic OMD) für das Stochastically Extended Adversarial (SEA) Modell mit glatten erwarteten Verlustfunktionen. Für konvexe und glatte Funktionen erhält Optimistic OMD dieselbe O(√σ²₁:T + √Σ²₁:T) Regret-Schranke wie die vorherige Arbeit von Sachs et al. (2022), aber unter schwächeren Annahmen. Für stark konvexe und glatte Funktionen erreicht Optimistic OMD eine bessere O(1/λ(σ²ₘₐₓ + Σ²ₘₐₓ) log((σ²₁:T + Σ²₁:T)/(σ²ₘₐₓ + Σ²ₘₐₓ))) Schranke. Außerdem wird für exp-konkave und glatte Funktionen eine neue O(d log(σ²₁:T + Σ²₁:T)) Schranke etabliert.