로봇 학습 분야에서 정책 평가 시 성공률 외에 다양한 지표와 통계 분석을 통해 보다 세부적이고 정확한 평가가 필요하다.
포인트 클라우드 관측을 이용하여 조건부 흐름 매칭 프레임워크로 로봇 조작 정책을 학습하는 방법을 제안한다.
전문가의 시연 데이터를 모방하여 전역적으로 안정적인 다항식 동적 시스템을 학습하는 방법을 제안합니다.
로봇 유틸리티 모델은 새로운 환경에서 추가 학습 없이 직접 일반화할 수 있는 정책을 제공한다.
사전 탐색된 의미 지도의 정확성을 고려하여 잘못된 결정을 수정하는 맥락 인식 재계획 방법을 제안한다.
로봇 조작 작업을 위해 오프라인 데이터를 활용하여 확산 기반 정책 학습 기법인 DiffClone을 제안하였다. 이를 통해 복잡한 로봇 조작 작업을 효과적으로 수행할 수 있는 정책을 학습할 수 있다.
로봇이 환경과 상호 작용하면서 언어를 학습할 수 있다는 것을 보여준다. 특히 사전 학습된 언어 모델을 활용하면 제한된 언어 입력을 넘어 자연스러운 언어 이해가 가능하다.
보간 기반 정책 확산 방법을 통해 정보가 풍부한 소스 정책에서 시작하여 목표 정책으로 효과적으로 이동할 수 있다.
본 연구는 로봇이 보이지 않는 물체를 효율적으로 조작하고 데모에 기반하여 관련 기술을 전달할 수 있는 능력을 부여하는 방법을 제안한다. 엔드-투-엔드 학습 방법은 종종 새로운 물체나 보이지 않는 구성에 일반화하지 못한다. 대신, 우리는 상호작용하는 물체의 관련 부분 간의 작업 특정 포즈 관계에 초점을 맞춘다. 이 관계는 동일한 범주의 새로운 물체로 전이될 수 있는 조작 작업의 일반화 가능한 개념이라고 가정한다.
소수의 인간 개입으로부터 다양한 정책 실수 분포를 포괄하는 대량의 개입 데이터를 자동으로 생성하여 로봇 정책의 강건성을 크게 향상시킬 수 있다.