핵심 개념
Maximierung des schlimmsten erwarteten Nutzens in Mehrspieler-Ressourcenteilungsspielen.
초록
Das Papier untersucht Mehrspieler-Ressourcenteilungsspiele mit fairer Belohnungszuweisung in zwei Einstellungen: einem Ein-Slot-Spiel und einem Online-Szenario. Im Ein-Slot-Spiel wird der schlimmste erwartete Nutzen von Spieler A1 maximiert, während im Online-Szenario ein Upper Confidence Bound (UCB) Algorithmus entwickelt wird, um den schlimmsten Fall des Bedauerns von Spieler A1 zu minimieren. Die Modelle haben Anwendungen in Kommunikationssystemen und Wirtschaft. Spezielle Fälle bieten Einblicke und effiziente Lösungsansätze.
Index
Einleitung
Formulierung des Modells
Ein-Slot-Spiel
Online-Szenario
Notation
Algorithmus
Theorem
통계
Die Summe aller pro Spieler Belohnungen der Ressourcen beträgt ihr Nutzen.
Der Algorithmus erreicht ein schlimmstes Bedauern von nD√T + 4n√2rT log(2nrCT3(T + 1)) + 1.
인용구
"Die Modelle haben Anwendungen in Kommunikationssystemen und Wirtschaft."