複雑な社会技術システムでの非対称情報確率ゲームへの適用が提案されています。COLは、フォーキャスター-アクター-クリティック(FAC)アーキテクチャを使用し、ベイズ学習を通じて推測を更新します。実験結果では、COLが他の強化学習手法よりも優れていることが示されています。これにより、合理性を保ちつつ効果的に戦略を適応させることが可能です。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Tao Li,Kim H... a las arxiv.org 03-01-2024
https://arxiv.org/pdf/2402.18781.pdfConsultas más profundas