下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
オフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
モデルベースのオフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
オフラインリインフォースメントラーニングにおいて、保守的なベルマン演算子を導入することで、性能と頑健性のトレードオフを実現し、計算コストを削減できる。
1