本論文では、競争的な多主体システムにおいて、外部観察者が各主体の非公開の行動-反応マッピングを能動的に学習する手法を提案している。
具体的には以下の通り:
N人の競争的な主体が存在し、各主体iは自身の意思決定変数xiを制御する。主体間の相互作用は非協力ゲームの枠組みで記述でき、全体としての制約条件x∈Ωを満たす必要がある。
外部観察者は各主体の行動-反応マッピングfiを学習することを目的とし、主体iに対して他主体の行動ˆx−iを提示し、主体iの反応xiを観測することができる。
外部観察者は、観測データを用いて行動-反応マッピングの近似モデルˆfiを逐次的に更新する能動学習アルゴリズムを提案している。
提案手法の収束性を解析し、ˆfiが収束すれば、その極限点が多主体システムの定常的な行動プロファイルx*に一致することを示している。これにより、外部観察者は正確な予測を行うことができる。
数値シミュレーションにより、提案手法の有効性を確認している。具体的には、スマートグリッドにおける需要家の価格反応予測や、一般化Nash均衡問題、競争的線形フィードバック設計問題などを取り上げている。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询