Kontextuelle Banditen mit vorhergesagtem Kontext: Effiziente Verarbeitung und Analyse von Inhalten für Erkenntnisse
Der Hauptbeitrag dieser Arbeit ist die Entwicklung eines neuen Online-Algorithmus, MEB (Measurement Error Bandit), der sublineare Regret-Garantien in kontextuellen Banditen mit verrauschtem Kontext bietet, bei denen nur begrenzte Kenntnisse über die Rauschverteilung vorliegen.