Core Concepts
Wir zeigen, dass der gierige Algorithmus auf eine breitere Palette von Armmerkmalsverteilungen anwendbar ist, als bisher angenommen. Insbesondere können wir Verteilungen mit asymmetrischer Unterstützung um den Ursprung behandeln.
Abstract
In dieser Arbeit betrachten wir das sparse kontextuelle Bandit-Problem, bei dem die Armmerkmale den Ertrag durch das Innere Produkt mit einem unbekannten, aber sparsamen Parameter beeinflussen. Bisherige Studien haben sparsitätsagnostische Algorithmen auf Basis der gierigen Armauswahl entwickelt, deren Analyse jedoch starke Annahmen an die Armmerkmalsverteilung erfordert, um eine ausreichende Diversität der ausgewählten Proben zu gewährleisten.
Wir zeigen, dass der gierige Algorithmus auf eine breitere Palette von Armmerkmalsverteilungen anwendbar ist. Zum einen zeigen wir, dass eine Mischverteilung mit einer gierig anwendbaren Komponente ebenfalls gierig anwendbar ist. Zum anderen schlagen wir neue Verteilungsklassen vor, die mit Gaußmischungen, diskreten und radialen Verteilungen zusammenhängen und für die die Probenvielfalt garantiert ist. Diese Klassen können Verteilungen mit asymmetrischer Unterstützung um den Ursprung beschreiben und bieten in Verbindung mit der ersten Behauptung theoretische Garantien für den gierigen Algorithmus bei einer sehr breiten Palette von Armmerkmalsverteilungen.
Stats
Die Armmerkmale Xi sind für jedes i ∈[K] beschränkt durch ∥Xi∥∞≤xmax < ∞.
Der unbekannte Parameter β∗ ist beschränkt durch ∥β∗∥1 ≤b < ∞.
Quotes
Keine relevanten Zitate gefunden.