この研究論文では、モデル情報が未知の2人プレイヤーゼロサムマルコフゲーム(TZMG)においてナッシュ均衡を求めるための新しい多段階ミニマックスQ学習(MMQL)アルゴリズムを提案しています。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Shreyas S R,... في arxiv.org 10-15-2024
https://arxiv.org/pdf/2407.04240.pdfاستفسارات أعمق