Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
確率近似法とマルコフ雑音を伴う強化学習
確率近似法と マルコフ雑音を伴う強化学習のための ODE 法
確率近似法アルゴリズムの安定性を、マルコフ雑音の設定で拡張した。これにより、特に線形関数近似と適格性追跡を用いた強化学習アルゴリズムの解析が大幅に改善される。
1