Core Concepts
複数エージェントのマルコフゲームにおける効率的な均衡学習アルゴリズムの提案と解析。
Stats
Lin-Confident-FTRLはε-CCEをO(ε^-2)で学習します。
サンプリング複雑性は˜O(min{ log(S)/d, maxi Ai}d3H6m2ε−2)です。
Quotes
"Recent works have attempted to solve this problem by employing independent linear function classes to approximate the marginal Q-value for each agent."
"Can we design more sample-efficient algorithms for MARL with independent linear function approximation under stronger access models?"