本論文は、デュオポリー非協力ゲームにおけるナッシュ均衡の追求に関する新しいアプローチを提案している。
主な内容は以下の通り:
未知の二次的な報酬関数の勾配(一次微分)を推定するために、正弦波の擾乱信号を用いる極値探索手法を採用している。これは、モデル情報を必要としない非協力ゲームに対する初めての取り組みである。
各プレイヤーは、対応する現在の状態変数と最後に送信された値との偏差を独立に評価し、プレイヤーの行動を更新する。これにより、アクチュエーションパスの帯域幅が制限されている中でも制御性能を維持し、閉ループダイナミクスの安定性を保証する。
時間スケーリング手法、ライアプノフの直接法、不連続システムの平均理論を用いて安定性解析を行い、ナッシュ均衡の周りの最終的な小さな残差集合のサイズを定量化している。
理論的な結果を数値例で示し、周期的なサンプルデータ制御手法と比較している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問