複雑な社会技術システムでの非対称情報確率ゲームへの適用が提案されています。COLは、フォーキャスター-アクター-クリティック(FAC)アーキテクチャを使用し、ベイズ学習を通じて推測を更新します。実験結果では、COLが他の強化学習手法よりも優れていることが示されています。これにより、合理性を保ちつつ効果的に戦略を適応させることが可能です。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Tao Li,Kim H... pada arxiv.org 03-01-2024
https://arxiv.org/pdf/2402.18781.pdfPertanyaan yang Lebih Dalam