Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
オフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
モデルベースのオフラインリインフォースメントラーニングにおける保守的なベルマン演算子の活用
オフラインリインフォースメントラーニングにおいて、保守的なベルマン演算子を導入することで、性能と頑健性のトレードオフを実現し、計算コストを削減できる。
1