Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
구성적 보수주의를 통한 오프라인 강화학습 성능 향상
오프라인 강화학습을 위한 구성적 보수주의: 앵커 탐색 기반 접근법
오프라인 강화학습에서 발생하는 분포 변화 문제를 해결하기 위해 상태 공간을 앵커와 델타로 분해하여 구성적 보수주의를 달성하는 접근법을 제안한다.
1