Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
모델 기반 오프라인 강화 학습에서의 보수적 벨만 연산자 활용
모델 기반 오프라인 강화 학습에서 보수적 벨만 연산자 활용
모델 기반 오프라인 강화 학습에서 보수적 벨만 연산자를 도입하여 성능과 강건성의 균형을 달성하는 새로운 알고리즘 MICRO를 제안한다.
1