Kernekoncepter
Das COLE-Framework überwindet effektiv kooperative Inkompatibilität und verbessert die Nullabstimmungsfähigkeiten.
Resumé
Das COLE-Framework zielt darauf ab, kooperative Inkompatibilität zu überwinden, indem es offene Ziele in kooperativen Spielen konstruiert und eine praktische Algorithmus implementiert, der Wissen aus Spieltheorie und Graphentheorie nutzt. Experimente im Overcooked-Spielumfeld zeigen, dass COLESV aktuelle Methoden übertrifft und kooperative Inkompatibilität effizient überwindet.
- Einleitung: Zero-shot-Koordination ist eine Herausforderung für kooperative KI, um Agenten zu trainieren, die mit einer breiten Palette von unsichtbaren Partnern zusammenarbeiten können.
- Verwandte Arbeiten: Methoden wie Selbstspiel und bevölkerungsbasiertes Training konzentrieren sich darauf, robuste Strategien zu trainieren, um ZSC zu erreichen.
- Preliminaries: Definitionen von Normalformspiel, empirischer Spielanalyse und kooperativen theoretischen Konzepten.
- Kooperatives offenes Lernen: Das COLE-Framework reformuliert kooperative Spiele und entwickelt empirische Spiellandschaften, um adaptive Fähigkeiten zu verbessern.
- Praktischer Algorithmus: COLESV kombiniert Shapley Value und Graphic Shapley Value, um kooperative Inkompatibilität zu bewerten und adaptive Fähigkeiten zu verbessern.
- Experimente: Experimente im Overcooked-Umfeld zeigen, dass COLESV kooperative Inkompatibilität überwindet und die Leistung mit verschiedenen Partnern verbessert.
Statistik
Zero-shot-Koordination bleibt eine Herausforderung für kooperative KI.
Das COLE-Framework überwindet kooperative Inkompatibilität effizient.
COLESV übertrifft aktuelle Methoden in der Koordination mit verschiedenen Partnern.
Citater
"Das COLE-Framework zielt darauf ab, kooperative Inkompatibilität zu überwinden und die Nullabstimmungsfähigkeiten zu verbessern."
"Experimente im Overcooked-Spielumfeld zeigen, dass COLESV aktuelle Methoden übertrifft und kooperative Inkompatibilität effizient überwindet."