Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
確率近似法とマルコフ雑音を伴う強化学習
確率近似法と マルコフ雑音を伴う強化学習のための ODE 法
確率近似法アルゴリズムの安定性を、マルコフ雑音の設定で拡張した。これにより、特に線形関数近似と適格性追跡を用いた強化学習アルゴリズムの解析が大幅に改善される。
1