본 논문은 장기 시간 과제를 위한 신경망 기반 제어기 학습 기법을 제안한다. 이를 위해 드롭아웃 기반의 샘플링 기법을 활용하여 기존 방식의 vanishing/exploding gradient 문제를 해결하고, 복잡한 시간 논리 사양에 대한 미분 가능한 새로운 계산 그래프를 제안한다.