Główne pojęcia
Wir schlagen eine Verlustfunktion vor, die es ermöglicht, Nash-Gleichgewichte in Normalform-Spielen durch unbiased Monte-Carlo-Schätzung zu approximieren. Dies führt zu neuen Algorithmen mit beweisbaren Garantien.
Streszczenie
Der Artikel befasst sich mit der Approximation von Nash-Gleichgewichten in Normalform-Spielen. Die Autoren stellen eine neue Verlustfunktion vor, die folgende Eigenschaften aufweist:
- Die globalen Minima der Verlustfunktion approximieren Nash-Gleichgewichte in Normalform-Spielen gut.
- Die Verlustfunktion lässt sich durch unbiased Monte-Carlo-Schätzung berechnen.
- Die Verlustfunktion ist Lipschitz-stetig und beschränkt.
Diese Eigenschaften ermöglichen den Einsatz leistungsfähiger Optimierungsverfahren wie stochastischen Gradientenabstieg (SGD) und banditbasierte Ansätze zur effizienten Approximation von Nash-Gleichgewichten.
Die Autoren analysieren die Eigenschaften der Verlustfunktion, einschließlich ihrer Gradienten und Hessen, und leiten daraus Konvergenzgarantien für die vorgeschlagenen Algorithmen her. Sie vergleichen die empirische Leistung von SGD mit dem Stand der Technik und zeigen, dass SGD in einigen Fällen bessere Ergebnisse liefert.
Statystyki
Die Verlustfunktion Lτ(x) ist beschränkt durch ±1/4 Σk ηkmk.
Die Lipschitz-Konstante der Verlustfunktion Lτ(x) ist ˆL = (ln(m∗)/(ln(1/p)) + 2)m∗2/(p ln(1/p)) + n ¯m.
Cytaty
"Wir schlagen die erste Verlustfunktion für approximative Nash-Gleichgewichte in Normalform-Spielen vor, die sich für unbiased Monte-Carlo-Schätzung eignet."
"Diese Konstruktion ermöglicht es uns, Standard-Verfahren der nicht-konvexen stochastischen Optimierung für die Approximation von Nash-Gleichgewichten einzusetzen, was zu neuartigen Algorithmen mit beweisbaren Garantien führt."