本文介紹了一個新的可定制的基於Isaac Gym的2D多智能體足球環境。作者採用了改進的全局實體編碼器(GEE)架構,並結合了各種課程設計和自我對抗訓練,成功訓練出了一個能夠在11v11的足球比賽中展現出高水平團隊合作行為的策略。
實驗結果顯示,該策略在3v3比賽中對抗HELIOS(目前最先進的啟發式策略)時,取得了66.8%的勝率。作者還提供了詳細的行為分析,展示了策略在定位、傳球、射門等方面的能力。
雖然該策略在一些特殊情況下仍存在局限性,但整體上展現出了強大的合作能力和適應性。未來的工作可以進一步探索3D環境、更複雜的動作模型,以及部分觀測和通信延遲等問題。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Zichong Li, ... um arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.20326.pdfTiefere Fragen