Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
モデルミスマッチ下での制約付き強化学習
モデルミスマッチ下での制約付き強化学習
モデルミスマッチが存在する環境下で、報酬を最大化しつつ制約を満たすロバストな方策を学習する。
1