강화 학습은 빠르게 움직이고 물체와 상호작용하는 도메인에서 복잡한 정책을 학습하는 데 유용한 도구이다. 이를 반영하기 위해 로봇 에어 하키 기반의 동적이고 상호작용적인 RL 테스트베드를 소개한다.