본 논문은 상태 추상화를 활용하여 대규모 상태 공간에서 오프-정책 평가의 정확성을 향상시키는 방법을 제안한다. 구체적으로 모델 기반 및 모델 자유 형태의 상태 추상화 조건을 정의하고, 이를 바탕으로 반복적인 상태 공간 압축 알고리즘을 제안한다. 이를 통해 다양한 오프-정책 평가 방법론의 Fisher 일치성을 보장한다.