المفاهيم الأساسية
部分的観測可能なマルチエージェント強化学習において、グラフ・アテンションを活用した新しい手法の提案とその理論的裏付け。
الملخص
伝統的なマルチエージェント強化学習アルゴリズムは大規模な環境での適用が難しい。本論文では、部分的に観測可能なマルチエージェント強化学習において、近隣エージェントからより重要な情報を抽出するための方法を開発しています。グラフ・アテンション構造を使用して、局所観察からより重要な近隣エージェントを選択し、平均行動を更新します。これにより、Nash均衡に近づきます。
الإحصائيات
̄𝑎𝑗 = 0.31
̄𝑎𝑗 = 0.42
̄𝑎𝑗 = 0.14
̄𝑎𝑗 = 0.13