전문가 작곡가 정책: 사지 로봇을 위한 확장 가능한 기술 레퍼토리
전문가 작곡가 정책은 사지 에이전트의 기술 레퍼토리를 안정적으로 확장하는 프레임워크를 제안합니다. 작곡가 정책은 전문가 간 전이를 통해 목표 상태로 연결하여 전문가들을 순차적으로 구성할 수 있습니다. 각 전문가는 보행 보행 또는 점프 동작과 같은 단일 기술에 특화됩니다. 계층적 또는 전문가 혼합 구조 대신, 우리는 다른 전문가 정책에 의존하지 않는 독립적인 프로세스에서 단일 작곡가 정책을 학습합니다. 이를 통해 기존 동작 품질을 보존하면서 새로운 전문가를 추가할 수 있어 점진적인 레퍼토리 확장이 가능합니다.