Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
価値関数の不確実性伝播
最大平均ディスクレパンシーバリセンターを用いた強化学習における価値関数の不確実性伝播
最大平均ディスクレパンシーバリセンターを利用することで、強化学習における価値関数の不確実性を効果的に伝播できる。
1