Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
オフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
モデルベースのオフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
オフラインリインフォースメントラーニングにおいて、保守的なベルマン演算子を導入することで、性能と頑健性のトレードオフを実現し、計算コストを削減できる。
1