Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
미래 보상 예측 정보의 활용
미래 보상 예측 정보의 강화 학습에서의 가치
강화 학습 에이전트가 미래 보상 정보를 활용하면 더 높은 보상을 얻을 수 있다. 이 논문에서는 미래 보상 정보의 활용 가치를 경쟁 분석 관점에서 정량적으로 분석한다.
1