본 논문에서는 강화학습에서 신경망 분해를 통해 재사용 가능한 하위 정책(sub-policy)을 추출하고, 이를 옵션으로 활용하여 새로운 작업에 대한 학습 속도를 향상시키는 방법을 제시합니다.