행동 기반 표현 학습은 고차원 관측 공간에서 강화 학습 에이전트의 견고성을 높이기 위해 중요하다. 이 연구는 행동 불변성을 활용하여 다단계 제어 관련 특징을 학습하는 새로운 방법인 행동 비유사성 인코딩을 제안한다.