Główne pojęcia
本文提出了一種新的安全多智能體強化學習方法,用於機器人團隊的協作導航,該方法無需為每個機器人設定個別目標位置,而是僅依靠隊形的中心點作為參考目標,並結合基於模型預測控制的安全機制,成功地在模擬和真實機器人實驗中實現了零碰撞的協作導航。
Dawood, M., Pan, S., Dengler, N., Zhou, S., Schoellig, A. P., & Bennewitz, M. (2024). Safe Multi-Agent Reinforcement Learning for Behavior-Based Cooperative Navigation. arXiv preprint arXiv:2312.12861v2.
本研究旨在開發一種安全的多智能體強化學習方法,使機器人團隊能夠在沒有個別目標位置的情況下進行協作導航,並確保在訓練和執行過程中避免碰撞。