本研究提出了一種"GNN for MBRL"模型,結合圖神經網絡(GNN)和模型驅動強化學習(MBRL)來解決多智能體系統(MAS)任務。
首先,研究利用GNN模型預測多個智能體的未來狀態和軌跡。然後,應用基於交叉熵方法(CEM)優化的模型預測控制(MPC)來協助自主智能體的動作規劃,成功完成了某些MAS任務。
具體來說,研究首先在基於視覺的多台球避撞環境中設計和驗證了"GNN for MBRL"模型,探索了圖神經網絡和模型驅動強化學習的更多可能性。然後,嘗試將這個有前景的框架轉移到複雜的自動駕駛應用場景。
研究生成了離散和連續的多台球避撞數據集,並在兩種情況下訓練了GNN動力學模型。結果表明,GNN模型在連續和離散環境中都能很好地工作,不需要對原始網絡架構進行任何更改。
最後,研究將訓練好的GNN模型與基於CEM的MPC方法相結合,在連續的多台球避撞環境中進行了實驗。結果顯示,與隨機和真實環境情況相比,"GNN_MPC"模型的性能顯著提高,碰撞率大幅降低,接近於真實環境的結果。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問