Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるポリシー設計
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるモデルフリー学習と最適ポリシー設計
中央プランナーは、事前にエージェントのドロップアウト確率を知った上で、期待システムの価値を最大化する最適なポリシーを見つける。
1