로봇의 운동학 및 동역학 구조에 내재된 대칭성을 활용하여 강화학습 기반 보행 제어 정책의 탐색 효율과 성능을 향상시킬 수 있다.
본 연구는 신호 시간 논리(STL)를 활용하여 비보행 로봇의 외란 회복 능력을 향상시키는 최적화 기법을 제안한다. STL 기반 최적화를 통해 로봇의 발 위치, 무게중심 궤적, 보폭 시간을 동시에 결정하여 안정적이고 강인한 보행을 달성한다.