Unduh Linnk AI
•
Asisten Riset
>
Masuk
wawasan
-
オンライン学習 ゲーム理論
強い単調性を持つゲームにおける無後悔オンラインバンディット学習の最適性
強い単調性を持つゲームにおいて、各プレイヤーが最適な無後悔バンディット学習アルゴリズムを適用すると、最後の反復で一意のナッシュ均衡に最適な収束率で収束する。
1