Scarica Linnk AI
•
Assistente di Ricerca
>
Accedi
approfondimento
-
Markov フロー方策 - ディープ MC
平均報酬強化学習のための Markov フロー方策 - ディープ MC
割引強化学習アルゴリズムの評価誤差を解決するために、Markov フロー方策を提案する。この方策は非負の神経ネットワークフローを利用して包括的な前方予測を可能にする。
1