Основні поняття
Maximierung des schlimmsten erwarteten Nutzens in Mehrspieler-Ressourcenteilungsspielen.
Анотація
Das Papier untersucht Mehrspieler-Ressourcenteilungsspiele mit fairer Belohnungszuweisung in zwei Einstellungen: einem Ein-Slot-Spiel und einem Online-Szenario. Im Ein-Slot-Spiel wird der schlimmste erwartete Nutzen von Spieler A1 maximiert, während im Online-Szenario ein Upper Confidence Bound (UCB) Algorithmus entwickelt wird, um den schlimmsten Fall des Bedauerns von Spieler A1 zu minimieren. Die Modelle haben Anwendungen in Kommunikationssystemen und Wirtschaft. Spezielle Fälle bieten Einblicke und effiziente Lösungsansätze.
Index
Einleitung
Formulierung des Modells
Ein-Slot-Spiel
Online-Szenario
Notation
Algorithmus
Theorem
Статистика
Die Summe aller pro Spieler Belohnungen der Ressourcen beträgt ihr Nutzen.
Der Algorithmus erreicht ein schlimmstes Bedauern von nD√T + 4n√2rT log(2nrCT3(T + 1)) + 1.
Цитати
"Die Modelle haben Anwendungen in Kommunikationssystemen und Wirtschaft."