Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
ギッティンズ指数の強化学習による推定
多腕バンディットにおけるタブラーおよび深層強化学習によるギッティンズ指数の推定
未知の遷移確率を持つマルコフ多腕バンディット問題において、タブラーおよび深層強化学習アルゴリズムを用いてギッティンズ指数を効率的に学習する。
1