Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
커널화된 강화 학습
최적 후회율 보장을 위한 커널화된 강화 학습
커널 릿지 회귀를 사용하여 대규모 상태-행동 공간과 복잡한 가치 함수에서 최적의 후회율 보장을 달성하는 강화 학습 알고리즘을 제안한다.
1