핵심 개념
연속적인 로봇 진화를 통해 전문가 정책을 소스 로봇에서 각 타겟 로봇으로 효율적으로 전이할 수 있다.
초록
이 논문은 전문가 정책을 소스 로봇에서 다수의 타겟 로봇으로 전이하는 문제를 다룹니다. 이를 위해 Meta-Evolve라는 새로운 방법을 제안합니다. Meta-Evolve는 연속적인 로봇 진화를 활용하여 다수의 "메타 로봇"으로 구성된 진화 트리를 통해 정책을 효율적으로 전이합니다.
구체적으로 다음과 같은 과정을 거칩니다:
소스 로봇과 타겟 로봇들의 운동학적 트리를 매칭하여 연속적인 로봇 파라미터 공간을 정의합니다.
소스 로봇과 타겟 로봇들을 연결하는 최적의 진화 트리를 구성합니다. 이때 L1 거리 기반의 Steiner 트리 알고리즘을 사용합니다.
소스 로봇의 전문가 정책을 메타 로봇들을 거쳐 각 타겟 로봇으로 순차적으로 전이합니다.
실험 결과, 이 방법은 기존 독립적인 one-to-one 정책 전이 방법에 비해 손 조작 작업에서 최대 3.2배, 민첩한 보행 작업에서 2.4배 더 효율적인 것으로 나타났습니다. 이는 진화 트리 구조를 통해 정책 전이 과정을 공유할 수 있기 때문입니다.
통계
손 조작 작업에서 Meta-Evolve 방법은 기존 방법 대비 최대 3.2배 더 적은 시뮬레이션 횟수로 목표 성능에 도달할 수 있었습니다.
민첩한 보행 작업에서 Meta-Evolve 방법은 기존 방법 대비 2.4배 더 적은 시뮬레이션 횟수로 목표 성능에 도달할 수 있었습니다.
인용구
"연속적인 로봇 진화를 통해 전문가 정책을 소스 로봇에서 각 타겟 로봇으로 효율적으로 전이할 수 있다."
"진화 트리 구조를 통해 정책 전이 과정을 공유할 수 있기 때문에 기존 방법 대비 더 효율적이다."