Effiziente Koordination von Mehrfachagenten durch unabhängiges Lernen von Zustandswerten und rundenbasierte Interaktion
Dieser Artikel stellt einen dezentralisierten Rahmen vor, der es Agenten ermöglicht, eine optimale kollektive Strategie zu bilden, ohne direkt miteinander zu kommunizieren. Dazu entwickeln wir zwei Schlüsselkomponenten: eine unabhängige zustandsbasierte Lernmethode (iQSS) und ein Interaktionsschema (ROMA), das die Zielausrichtung der Agenten fördert.