Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
モデルミスマッチ下での制約付き強化学習
モデルミスマッチ下での制約付き強化学習
モデルミスマッチが存在する環境下で、報酬を最大化しつつ制約を満たすロバストな方策を学習する。
1