핵심 개념
자유형 로봇을 위한 정책 그래디언트 방법 소개
초록
동물의 형태적 적응성에 영감을 받아 로봇의 물리적 측면을 포함한 훈련을 확장하는 연구가 증가하고 있음.
정책 그래디언트를 사용하여 자유형 로봇을 설계하는 방법을 소개.
로봇의 형태와 내부 구조를 최적화하기 위해 원자 구조 요소인 보급물질을 추가하거나 제거하는 행동을 통해 높은 수준의 비모수적 대형 구조를 형성.
물리적 기계에 대한 시뮬레이션만 제공되지만, 미래에는 폐쇄 루프 제어 및 물리적 기계로의 전이를 위해 이 방법을 적용할 수 있음.
통계
로봇의 몸체 부피를 최대화하는 간단한 구조적 목표에 대한 정책 훈련을 500회 반복하여 5개의 독립적인 시행에서 실시.
로봇의 수평 평면에서 시작과 끝 위치 사이의 최대 유클리드 거리를 측정하여 5초 평가 기간 동안 로봇의 행동 보상을 측정하는 128개 디자인의 최적화.
인용구
"로봇의 물리적 구조는 정책 최적화를 용이하게 하거나 방해할 수 있음."
"자유형 로봇을 설계하기 위한 정책 그래디언트 방법 소개."