Core Concepts
인간형 로봇을 위한 자연스러운 이동 및 전환 학습
Abstract
I. Abstract
인간형 로봇에게 자연스러운 전신 이동 패턴을 복제하고 인간 동작을 모방하여 원활한 전환을 실행하는 Wasserstein 적대적 모방 학습 시스템 소개
Reinforcement Learning (RL)과 적대적 평가자 구성 요소 통합
Integral Probabilistic Metric (IPM)인 Wasserstein-1 거리와 소프트 경계 제약을 활용하여 안정적인 훈련 프로세스 유지 및 모델 붕괴 방지
시뮬레이터에서 평가된 시스템은 다양한 이동 패턴을 보여줌
II. Introduction
인간형 로봇에게 자연스러운 이동 및 전환 전달의 어려움
깊은 강화 학습이 복잡한 모델링 과정을 줄이고 발전된 이동 기술 개발에 인기
그러나 RL로 생성된 움직임은 종종 원치 않는 전신 행동을 나타냄
III. Motion Retargeting
기본 스켈레톤 바인딩, 좌표 변환, 다중 목적 역운동학, 후처리 절차 소개
인간과 로봇 사이의 모폴로지적 차이를 해결하기 위한 유연한 움직임 재지정 방법
IV. Wasserstein Adversarial Imitation
Wasserstein 적대적 모방 학습 프레임워크 소개
속도 목표 조건 강화 학습, Wasserstein 평가자, PD 컨트롤러 포함
속도 명령에 따라 인간형 로봇이 속도를 따르도록 하는 속도 조건 강화 학습
V. Experiment
Isaac Gym에서 Choreonoid로의 시뮬레이션 전환 테스트
푸시 복구 및 계단 오르내리기 작업에서 뛰어난 견고성을 보임
VI. Conclusion
인간의 시범 데이터셋에서 다양한 자연스러운 이동 기술 습득
소프트 경계 제약이 훈련 과정을 안정화하고 모델 붕괴 위험 감소
Stats
인간형 로봇의 속도 목표: 0.0 m/s ~ 5.0 m/s
학습 데이터셋: Stand, Squat Walk, Normal Walk, Run
Quotes
"우리의 제안된 소프트 경계 제약 Wasserstein-1 손실은 훈련 과정을 안정화시키고 모델 붕괴 위험을 줄이는 것으로 입증되었습니다."
"인간형 로봇의 다양한 이동 패턴을 캡처하고 속도 변화에 따른 원활한 전환을 가능하게 합니다."