Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるポリシー設計
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるモデルフリー学習と最適ポリシー設計
中央プランナーは、事前にエージェントのドロップアウト確率を知った上で、期待システムの価値を最大化する最適なポリシーを見つける。
1