Core Concepts
COLは、非対称情報確率ゲームにおけるオンライン適応性の欠如を解決するための新しい学習スキームであり、Berk-Nash均衡に収束することが証明されています。
Abstract
複雑な社会技術システムでの非対称情報確率ゲームへの適用が提案されています。COLは、フォーキャスター-アクター-クリティック(FAC)アーキテクチャを使用し、ベイズ学習を通じて推測を更新します。実験結果では、COLが他の強化学習手法よりも優れていることが示されています。これにより、合理性を保ちつつ効果的に戦略を適応させることが可能です。
Stats
COLはBerk-Nash均衡に収束することが証明されています。
実験結果から、COLは64台の仮想サーバーで10種類の侵入に対して優れたパフォーマンスを示しています。