Linnk AIをダウンロード
•
AIリサーチアシスタント
>
サインイン
インサイト
-
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるポリシー設計
確率的エージェントドロップアウトを伴う多エージェントMDPにおけるモデルフリー学習と最適ポリシー設計
中央プランナーは、事前にエージェントのドロップアウト確率を知った上で、期待システムの価値を最大化する最適なポリシーを見つける。
1