Core Concepts
Dieser Artikel zielt darauf ab, die Grenzen der Auflösung von ergebnisbasierten Algorithmen zur unvollständigen Erinnerungsabstraktion in Spielen mit geordneten Signalen zu erweitern.
Abstract
Der Artikel befasst sich mit der mathematischen Modellierung der Handabstraktion in Spielen mit geordneten Signalen, einer Klasse von Spielen mit unvollständiger Information, zu denen auch Texas Hold'em Poker gehört.
Zunächst wird die Definition von Spielen mit geordneten Signalen verfeinert, um sie klarer und vielseitiger zu gestalten. Dann wird die Aufgabe der Signalabstraktion innerhalb dieses Modells formal definiert.
Der Hauptteil des Artikels konzentriert sich auf die Untersuchung der Auflösungsgrenze von ergebnisbasierten Algorithmen zur unvollständigen Erinnerungsabstraktion. Es wird ein neuer Algorithmus namens Potential Outcome Isomorphism (POI) eingeführt, der versucht, die maximal mögliche Anzahl an abstrahierten Signalinformationsmengen basierend auf zukünftigen Showdown-Ergebnissen zu identifizieren.
Anschließend wird ein theoretisches Konzept namens Common Refinement präsentiert, um die Auflösungsgrenzen von Signalabstraktionsalgorithmen zu bewerten. Es wird gezeigt, dass POI eine gemeinsame Verfeinerung für führende ergebnisbasierte Algorithmen zur unvollständigen Erinnerungsabstraktion wie E[HS] und PA&PAEMD darstellt. Daraus folgt, dass diese Algorithmen ebenfalls unter übermäßiger Abstraktion leiden.
Um diese Einschränkung zu überwinden, wird schließlich ein neuer Algorithmus namens k-Recall Outcome Isomorphism (KROI) entwickelt, der historische Informationen berücksichtigt, um die Auflösungsgrenze zu erweitern. Experimentelle Ergebnisse zeigen, dass KROI die Leistung im Vergleich zu POI deutlich verbessert.
Stats
Es gibt 50 Karten im Standardpokerblatt.
In Texas Hold'em können Signale im Flop-Stadium zu 50 möglichen Signalen im Turn-Stadium übergehen.
Im Turn-Stadium können Signale zu 47 möglichen Signalen im River-Stadium übergehen.
Quotes
"Dieser Artikel zielt darauf ab, die Grenzen der Auflösung von ergebnisbasierten Algorithmen zur unvollständigen Erinnerungsabstraktion in Spielen mit geordneten Signalen zu erweitern."
"POI dient als gemeinsame Verfeinerung für führende ergebnisbasierte Algorithmen zur unvollständigen Erinnerungsabstraktion wie E[HS] und PA&PAEMD, was darauf hindeutet, dass diese Algorithmen ebenfalls unter übermäßiger Abstraktion leiden."
"KROI bietet einen Rahmen, um den Entwurf von Algorithmen zur ergebnisbasierten unvollständigen Erinnerungsabstraktion mit höherer Auflösung zu leiten."