Der Artikel befasst sich mit der Analyse und Verarbeitung von Inhalten zu linearen korrelierten Gleichgewichten in extensiven Spielen.
Zunächst wird eine Verbindung zwischen linearen Abweichungen und einer Verallgemeinerung von Kommunikationsabweichungen hergestellt, bei denen der Spieler Anfragen an einen "Mediator" stellen kann, der ihm Aktionsempfehlungen gibt, ohne an den zeitlichen Ablauf des Spiels gebunden zu sein (untimed communication (UTC) Abweichungen). Es wird gezeigt, dass die UTC Abweichungen genau den linearen Abweichungen entsprechen.
Darauf aufbauend werden effiziente Algorithmen zum Lernen linearer korrelierter Gleichgewichte entwickelt. Theoretisch erreichen diese polynomiell bessere Laufzeiten pro Iteration als der bisherige Stand der Technik. Praktisch sind die Algorithmen um mehrere Größenordnungen schneller.
Die Experimente zeigen, dass die vorgestellten Methoden deutlich effizienter sind als der bisherige Stand der Technik, sowohl in Bezug auf die Laufzeit pro Iteration als auch in Bezug auf die Konvergenzgeschwindigkeit.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Brian Hu Zha... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2310.15935.pdfDeeper Inquiries