Napolitano, I., Lama, A., De Lellis, F., di Bernardo, M. (2024). Emergent Cooperative Strategies for Multi-Agent Shepherding via Reinforcement Learning. arXiv preprint arXiv:2411.05454v1.
本研究旨在開發一種去中心化的強化學習方法,解決多智能體牧羊人控制問題,並放鬆傳統方法中對目標群體凝聚力的假設。
研究人員提出了一種基於深度Q學習(DQL)的雙層控制架構。底層控制器引導每個牧羊人將特定目標控制在目標區域內,而高層控制器則動態地從多個目標中選擇一個目標,讓牧羊人進行追蹤和控制。通過在共享環境中訓練多個牧羊人智能體,並採用策略共享協議,實現了智能體間的合作。
研究結果表明,基於強化學習的去中心化控制策略可以有效解決多智能體牧羊人問題,並在沒有凝聚力假設的情況下實現智能體間的湧現式合作。
本研究為解決複雜的多智能體協作問題提供了一種新的思路,並在機器人控制、人群疏導等領域具有潛在應用價值。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania