多エージェントシステムにおける複雑な相互作用を深く調査するために、グラフニューラルネットワークとモデルベース強化学習を組み合わせた"GNN for MBRL"モデルを提案する。
異種の攻撃者チームに対して、最小限の防衛エージェントタイプで最適に対抗できる。
多エージェント強化学習において、自動的なグループ編成と人間の支援を組み合わせることで、複雑な課題の遂行を効果的に支援する。
複雑な推論問題に対するLLMの能力を向上させるため、多エージェントアプローチとツリー型思考探索を組み合わせ、思考の妥当性を検証するエージェントを導入する。
多様性は自然システムにおける回復力を高めることが進化科学から示されているが、従来の多エージェント強化学習手法では均質性を強制することで学習サンプル効率を高めてきた。学習エージェントが均質な方策に制限されない場合、個体が多様な行動を発達させ、システムに相補的な効果をもたらすことがある。しかし、行動の多様性を定量化する手法は驚くほど少ない。そのような手法を開発することで、集合型人工知能における多様性の影響を理解し、その制御を可能にすることができる。
多エージェントシステムの確率的最適化問題では、サブ問題への分解や意思決定空間の縮小が可能である。循環的アプローチと分散的アプローチは、このような問題を解決するための2つの主要な戦略である。
本研究は、有向ハイパーグラフモジュールを組み込んだ多エージェント強化学習フレームワークを提案し、交差点間の複雑な時空間相関を効果的に捉えることで、交通信号灯制御の最適化を実現する。
本研究では、並列自己回帰デコーディングを活用することで、多エージェントの組合せ最適化問題を効率的に解決するPARCOというアプローチを提案する。PARCOは、エージェント間の協調を促す特別な通信層と、競合を解決するための優先度ベースの手法を備えている。
十分な大きさのエントロピー正則化の下で、多エージェントシステムは量子応答均衡に線形収束する。
長期的な経験を通じて、エージェントは非協力的な隣人を識別し、協力的な隣人との相互作用を好むようになる。この自己組織化された行動は、ネットワークの相互性を高め、グループ全体の協力を促進する。