本論文は、非協力動的ゲームにおける一般化フィードバックナッシュ均衡の効率的な求解手法を提案している。
まず、システムレベル合成(SLS)フレームワークを用いて、プレイヤーの状態フィードバックポリシーを応答関数の形で表現する。これにより、各プレイヤーのベストレスポンス更新則を、有限次元の堅牢最適化問題として定式化できる。
次に、このベストレスポンス動学に基づくアルゴリズム(SLS-BRD)を提案する。SLS-BRDでは、各プレイヤーが自身のポリシーを同時に更新し、通信ネットワークを通じて共有する。一定の条件の下で、SLS-BRDは一般化フィードバックナッシュ均衡に収束することが示される。さらに、線形二次確率ゲームの特殊ケースにおいて、収束条件と収束率を明らかにする。
最後に、マルチエージェントシステムの分散制御問題に対するシミュレーション例を示し、提案手法の有効性を確認する。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Otacilio B. ... às arxiv.org 04-08-2024
https://arxiv.org/pdf/2404.03809.pdfPerguntas Mais Profundas