Descarga Linnk AI
•
Asistente de Investigación
>
Iniciar sesión
Información
-
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるポリシー設計
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるモデルフリー学習と最適ポリシー設計
中央プランナーは、事前にエージェントのドロップアウト確率を知った上で、期待システムの価値を最大化する最適なポリシーを見つける。
1