완전 관측 비결정적 계획 영역에 대한 일반화된 정책을 학습하는 방법을 제안한다. 이는 고전적 계획 문제에 대한 일반화된 정책 학습 방법을 확장한 것으로, 비결정적 행동 효과의 불확실성을 초기 상태의 불확실성으로 변환하여 고전적 계획 문제로 해결한다.