Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
オフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
モデルベースのオフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
オフラインリインフォースメントラーニングにおいて、保守的なベルマン演算子を導入することで、性能と頑健性のトレードオフを実現し、計算コストを削減できる。
1