Kernkonzepte
Untersuchung der Reduzierung von Misserfolgen der Koordination zwischen erwartungsnutzungsmaximierenden Agenten durch sichere Pareto-Verbesserungen.
Zusammenfassung
In diesem Artikel wird die Anwendung von sicheren Pareto-Verbesserungen (SPIs) in Programm-Spielen untersucht, um die Koordination zwischen erwartungsnutzungsmaximierenden Agenten zu verbessern. Die Autoren zeigen, dass unter bestimmten Annahmen die Verwendung von Programmen, die in der Lage sind, ihre Entscheidungen auf den Quellcodes ihrer Gegenspieler zu basieren, zu besseren Ergebnissen führen kann. Durch die Einführung von SPIs mittels Programmen, die in der Lage sind, zu neu verhandeln, wird gezeigt, dass Spieler immer Programme bevorzugen, die eine Pareto-Verbesserung garantieren. Es wird auch gezeigt, dass die Verhandlung nicht unbedingt zu Verbesserungen führt, die über einen bestimmten Grenzwert hinausgehen.
Einleitung
AI-Systeme werden zunehmend in der Interaktion mit anderen Agenten eingesetzt.
Risiko der Misserfolge bei der Koordination in Spielen wie Chicken.
Bedeutung der Erforschung von Kooperations-KI.
Verwandte Arbeit
Programmgleichgewicht und Verpflichtungsspiele.
Literatur zu Koordinationsproblemen und Gleichgewichtsauswahl.
Miscoordination und sichere Pareto-Verbesserungen in Programm-Spielen
Einführung des Programm-Spiele-Frameworks und des subjektiven Gleichgewichts.
Überprüfung der sicheren Pareto-Verbesserungen.
Konstruktion von SPIs durch Neuverhandlung.
Garantie der PMM-Payoffs mit CSR
Einführung von bedingten Neuverhandlungssets.
Konstruktion von CSR-Programmen.
Garantie der Pareto-Minimum-Payoffs mit CSR.
Statistiken
Unter milden Annahmen bevorzugen Spieler immer die Verwendung von Neuverhandlungsprogrammen.
Spieler bevorzugen Programme, die ihnen mindestens ihre PMM-Payoffs garantieren.
Zitate
"Unter milden Annahmen zeigen wir, dass SPIs immer in einem subjektiven Gleichgewicht verwendet werden."
"Durch die Fähigkeit von AI-Systemen, ihre Entscheidungen auf die inneren Arbeitsweisen anderer zu stützen, könnte die Misserfolgsrate bei Koordinationsproblemen verringert werden."