Core Concepts
강화 학습에서 정상성 가정을 테스트하고 변화점을 감지하는 중요한 방법론 소개
Abstract
오프라인 강화 학습 방법론에서 정상성 가정의 중요성과 한계
모델 없이 통계적으로 정상성을 평가하고 변화점을 감지하는 새로운 방법론 소개
최적 Q-함수의 정상성을 평가하고 변화점을 감지하는 효과적인 절차 제시
제안된 테스트의 이론적 및 실제적인 유효성에 대한 상세한 설명
변화점 감지 방법론의 구체적인 적용 및 결과 분석
Stats
많은 RL 알고리즘은 정상성 가정에 의존
강화 학습에서 정상성 가정이 어려움을 초래할 수 있음
COVID-19 대응을 위한 RL의 중요성
Quotes
"Nonstationarity is the case most commonly encountered in reinforcement learning." - Sutton and Barto (2018)