Interaktive Beweise ermöglichen es einem Verifizierer, die Ergebnisse eines unzuverlässigen Lernenden (oder Beweisers) zu überprüfen, ohne die Lernaufgabe selbst von Grund auf durchführen zu müssen. Die Autoren konstruieren interaktive Protokolle, die es dem Verifizierer ermöglichen, bestimmte Klassen von Booleschen Funktionen, wie schwere Fourier-Charaktere, AC0[2]-Schaltkreise und k-Juntas, agnostisch zu lernen, wobei der Verifizierer deutlich weniger Ressourcen verwendet als der ehrliche Beweiser.
Wir präsentieren zwei Algorithmen, B-GLinCB und RS-GLinCB, die optimale Regret-Garantien für generalisierte lineare kontextuelle Banditen in Szenarien mit begrenzter Anpassungsfähigkeit liefern. Unsere Algorithmen eliminieren die Abhängigkeit vom Nichtlinearitätsparameter κ, der in früheren Arbeiten auftrat.
In dieser Arbeit wird ein effizienter Rahmen namens Continuous Dynamic Tuning (CDT) vorgestellt, um die Hyperparameter von kontextuellen Bandit-Algorithmen in Echtzeit kontinuierlich zu optimieren, ohne eine vorgegebene Menge von Kandidaten zu benötigen. Der Schlüsselaspekt ist die Formulierung der Hyperparameteroptimierung als ein nicht-stationäres Lipschitz-Bandit-Problem auf einem kontinuierlichen Raum, für das ein neuer Zooming TS-Algorithmus mit Restarts entwickelt wird.
Die Studie charakterisiert die fundamentalen Grenzen der Effizienz moderner Hopfield-Modelle und präsentiert einen nahezu linearen Algorithmus zur Lösung des Assoziativspeicher-Abrufproblems.
Wir erweitern Bayesianische Multi-Armed Bandit-Algorithmen über ihren ursprünglichen Anwendungsbereich hinaus, indem wir sequenzielle Monte-Carlo-Methoden (SMC) verwenden. Unser SMC-basiertes Multi-Armed Bandit-Framework kann nicht-stationäre Bandits mit nichtlinearen und nicht-Gaußschen Belohnungsfunktionen erfolgreich adressieren.
In dieser Arbeit werden Datenstromalgorithmen präsentiert, die optimale Aufteilungen beim Entscheidungsbaumlernen berechnen. Für Regressions- und Klassifikationsprobleme werden effiziente Streaming-Algorithmen entwickelt, die sublineare Speicherplatzanforderungen und eine geringe Anzahl von Durchläufen durch den Datenstrom haben.
Eine neuartige Methode zur impliziten Transformation von Zufallswäldern in effiziente neuronale Netze durch Imitationslernen. Das vorgeschlagene Verfahren ermöglicht das Lernen und die Initialisierung von neuronalen Netzen mit sehr wenigen Trainingsdaten.
Ein robuster und effizienter Algorithmus für die Niedrigrang-Matrixergänzung, der approximative Lösungen für die Teilprobleme verwendet und dennoch die Konvergenz garantiert sowie eine Laufzeit von nahezu linearer Zeit in der Anzahl der beobachteten Einträge erreicht.
Das Ziel ist die Entwicklung von Algorithmen, die auf Invarianzprinzipien basieren und sowohl eine zuverlässige domänenübergreifende Generalisierung als auch algorithmische Fairness in Situationen mit Verteilungsverschiebungen zwischen Trainings- und Testdaten erreichen.
FAIR MP-BOOST ist ein stochastisches Boosting-Verfahren, das Fairness und Genauigkeit durch adaptives Lernen von Merkmalen und Beobachtungen während des Trainings ausbalanciert.