تنزيل Linnk AI
•
مساعد بحث
>
سجل دخولك
رؤى
-
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるポリシー設計
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるモデルフリー学習と最適ポリシー設計
中央プランナーは、事前にエージェントのドロップアウト確率を知った上で、期待システムの価値を最大化する最適なポリシーを見つける。
1