인간은 뛰어난 촉각 감지 능력을 가지고 있으며, 이를 활용하여 시각적 관찰만으로는 해결할 수 없는 부분적으로 관찰 가능한 과제를 해결할 수 있다. 이 연구에서는 강화 학습을 사용하여 촉각 센서 데이터를 직접 행동으로 매핑하는 엔드-투-엔드 정책을 학습하여 부분적으로 관찰 가능한 로봇 삽입 작업을 해결한다.