Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
오프라인 데이터를 활용한 온라인 강화학습 알고리즘
온라인 알고리즘을 오프라인 데이터로 초기화하여 성능 향상을 달성하는 하이브리드 강화학습 알고리즘
오프라인 데이터를 온라인 알고리즘의 경험 재생 버퍼에 포함시키는 간단한 방법으로도 오프라인 데이터의 품질이 낮은 경우에도 온라인 학습 성능을 향상시킬 수 있다.
1