מושגי ליבה
Durch die Koordination der Optimierung von Mehrfachagenten-Navigationspolitik und Umgebungskonfiguration kann die Navigationsleistung des Mehrfachagenten-Systems insgesamt verbessert werden.
תקציר
Der Artikel betrachtet ein Mehrfachagenten-System und seine Umgebung als ein sich co-entwickelndes System, bei dem sich das Verhalten des einen auf das andere auswirkt. Das Ziel ist es, sowohl die Aktionen der Agenten als auch die Konfigurationen der Umgebung als Entscheidungsvariablen zu betrachten und diese beiden Komponenten in koordinierter Weise zu optimieren, um eine bestimmte Zielgröße zu verbessern.
Dazu wird das Problem der dezentralen Mehrfachagenten-Navigation in unübersichtlichen Umgebungen betrachtet. Durch die Einführung von zwei Teilzielen - Mehrfachagenten-Navigation und Umgebungsoptimierung - wird ein Agent-Umgebung-Co-Optimierungsproblem formuliert und ein koordinierter Algorithmus entwickelt, der zwischen diesen Teilzielen hin- und herwechselt, um eine optimale Synthese von Agentenaktionen und Hinderniskonfigurationen in der Umgebung zu finden, um die Navigationsleistung zu verbessern.
Da die explizite Modellierung der Beziehung zwischen Agenten, Umgebung und Leistung eine Herausforderung darstellt, wird ein modellfreier Lernmechanismus innerhalb des koordinierten Rahmens verwendet. Eine formale Konvergenzanalyse zeigt, dass der koordinierte Algorithmus der lokalen Minimumstrajektorie eines zugehörigen zeitvarianten nichtkonvexen Optimierungsproblems folgt. Umfangreiche numerische Ergebnisse bestätigen die theoretischen Erkenntnisse und zeigen die Vorteile der Co-Optimierung gegenüber Basislinien. Interessanterweise deuten die Ergebnisse auch darauf hin, dass optimierte Umgebungskonfigurationen in der Lage sind, strukturelle Anleitung zu bieten, die für die Entflechtung von Agenten in Bewegung entscheidend ist.
סטטיסטיקה
Die maximale Beschleunigung beträgt 1 m/s².
Die maximale Geschwindigkeit beträgt 1,5 m/s.
Der Kommunikationsradius beträgt 2 m.
Die maximale Zeit beträgt 500 Zeitschritte.
Jeder Zeitschritt dauert 0,05 s.
ציטוטים
"Durch die Koordination der Optimierung von Mehrfachagenten-Navigationspolitik und Umgebungskonfiguration kann die Navigationsleistung des Mehrfachagenten-Systems insgesamt verbessert werden."
"Eine formale Konvergenzanalyse zeigt, dass der koordinierte Algorithmus der lokalen Minimumstrajektorie eines zugehörigen zeitvarianten nichtkonvexen Optimierungsproblems folgt."
"Interessanterweise deuten die Ergebnisse auch darauf hin, dass optimierte Umgebungskonfigurationen in der Lage sind, strukturelle Anleitung zu bieten, die für die Entflechtung von Agenten in Bewegung entscheidend ist."