강화 학습에서 상태 및 히스토리 표현 학습은 핵심적인 문제이다. 본 연구는 다양한 표현 학습 방법들이 공통적으로 자기 예측 표현을 학습하고 있음을 보이고, 이를 효과적으로 학습하는 방법을 제안한다.