Linnk AIをダウンロード
•
AIリサーチアシスタント
>
サインイン
インサイト
-
Markov フロー方策 - ディープ MC
平均報酬強化学習のための Markov フロー方策 - ディープ MC
割引強化学習アルゴリズムの評価誤差を解決するために、Markov フロー方策を提案する。この方策は非負の神経ネットワークフローを利用して包括的な前方予測を可能にする。
1