Effiziente Algorithmen für generalisierte lineare kontextuelle Banditen mit begrenzter Anpassungsfähigkeit
Wir präsentieren zwei Algorithmen, B-GLinCB und RS-GLinCB, die optimale Regret-Garantien für generalisierte lineare kontextuelle Banditen in Szenarien mit begrenzter Anpassungsfähigkeit liefern. Unsere Algorithmen eliminieren die Abhängigkeit vom Nichtlinearitätsparameter κ, der in früheren Arbeiten auftrat.