複雑な社会技術システムでの非対称情報確率ゲームへの適用が提案されています。COLは、フォーキャスター-アクター-クリティック(FAC)アーキテクチャを使用し、ベイズ学習を通じて推測を更新します。実験結果では、COLが他の強化学習手法よりも優れていることが示されています。これにより、合理性を保ちつつ効果的に戦略を適応させることが可能です。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Tao Li,Kim H... alle arxiv.org 03-01-2024
https://arxiv.org/pdf/2402.18781.pdfDomande più approfondite