Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
Markov フロー方策 - ディープ MC
平均報酬強化学習のための Markov フロー方策 - ディープ MC
割引強化学習アルゴリズムの評価誤差を解決するために、Markov フロー方策を提案する。この方策は非負の神経ネットワークフローを利用して包括的な前方予測を可能にする。
1