로봇 조작 작업을 위해 오프라인 데이터를 활용하여 확산 기반 정책 학습 기법인 DiffClone을 제안하였다. 이를 통해 복잡한 로봇 조작 작업을 효과적으로 수행할 수 있는 정책을 학습할 수 있다.
로봇이 환경과 상호 작용하면서 언어를 학습할 수 있다는 것을 보여준다. 특히 사전 학습된 언어 모델을 활용하면 제한된 언어 입력을 넘어 자연스러운 언어 이해가 가능하다.
보간 기반 정책 확산 방법을 통해 정보가 풍부한 소스 정책에서 시작하여 목표 정책으로 효과적으로 이동할 수 있다.
본 연구는 로봇이 보이지 않는 물체를 효율적으로 조작하고 데모에 기반하여 관련 기술을 전달할 수 있는 능력을 부여하는 방법을 제안한다. 엔드-투-엔드 학습 방법은 종종 새로운 물체나 보이지 않는 구성에 일반화하지 못한다. 대신, 우리는 상호작용하는 물체의 관련 부분 간의 작업 특정 포즈 관계에 초점을 맞춘다. 이 관계는 동일한 범주의 새로운 물체로 전이될 수 있는 조작 작업의 일반화 가능한 개념이라고 가정한다.
소수의 인간 개입으로부터 다양한 정책 실수 분포를 포괄하는 대량의 개입 데이터를 자동으로 생성하여 로봇 정책의 강건성을 크게 향상시킬 수 있다.
ROS 2 메시지 전달 인프라를 전용 하드웨어 칩에 직접 구현하여 로봇 통신의 속도와 효율성을 크게 향상시켰습니다.
접촉 피드백을 제어 루프에 통합하는 오프라인 강화 학습 접근법을 통해 가구 조립 문제를 더 일반화할 수 있는 방식으로 해결하고자 한다.
본 논문은 트리플렛 합성곱 신경망을 활용하여 실내 환경에서 로봇의 위치를 추정하는 문제를 다룹니다. 계층적 위치 추정 방법과 전역 위치 추정 방법을 제안하며, 다양한 트리플렛 손실 함수의 성능을 비교 분석합니다.
RISE는 단일 뷰 포인트 클라우드에서 연속적인 로봇 동작을 직접 예측하는 엔드-투-엔드 기반라인을 제시한다.
인간 피드백을 활용하여 보상 함수를 학습할 때 발생할 수 있는 보상 과최적화 문제를 해결하기 위해 새로운 정규화 기법을 제안한다.