核心概念
本文提出了一種基於actor-critic方法的分佈式原始對偶算法,利用局部信息估計拉格朗日乘數,解決了合作受限多代理強化學習問題,並證明了算法的收斂性。
Kahe, A., & Kebriaei, H. (2024). A Distributed Primal-Dual Method for Constrained Multi-agent Reinforcement Learning with General Parameterization. arXiv preprint arXiv:2410.15335.
本研究旨在解決合作受限多代理強化學習(CMARL)問題,其中代理的目標是在共享約束條件下最小化全局目標函數。