시뮬레이션에서 학습한 정책을 실제 세계로 전이하는 것은 범용 로봇을 실현하는 데 핵심적이지만, 시뮬레이션과 현실 사이의 격차를 해결하는 것이 어렵다. 이 연구에서는 인간이 개입하여 실시간으로 로봇 정책을 수정하고 이를 통해 다양한 격차를 해결하는 TRANSIC 방법을 제안한다.
비디오 데이터를 활용하여 로봇이 다양한 조작 기술을 효과적으로 학습할 수 있는 방법을 제시한다.
강화 학습은 빠르게 움직이고 물체와 상호작용하는 도메인에서 복잡한 정책을 학습하는 데 유용한 도구이다. 이를 반영하기 위해 로봇 에어 하키 기반의 동적이고 상호작용적인 RL 테스트베드를 소개한다.
단일 데모를 통해 다양한 물체와 환경에서 장기 외부 조작 작업을 수행할 수 있는 방법을 제안한다. 접촉 요구사항을 재조정하여 기존 데모의 기본 동작들을 새로운 환경에 적용할 수 있게 한다.
이 논문은 신경형태학적 접근을 통해 로봇 조작 시 장애물 회피 문제를 해결하는 방법을 제안한다. 주요 내용은 다음과 같다: 이벤트 카메라(EC)에서 감지된 이벤트 데이터를 합성곱 스파이킹 신경망(C-SNN)으로 처리하여 장애물 회피 가속도를 계산한다. 사전 계획된 궤적에 이 가속도를 추가하여 동적 모션 프리미티브(DMP) 기반으로 궤적을 실시간 적응시킨다. 시뮬레이션과 실제 실험을 통해 제안 방식이 기존 방식에 비해 장애물을 안정적으로 회피할 수 있음을 보였다. 이벤트 데이터 생성 방식, SNN 가중치 변화 등이 성능에 미치는 영향을 분석하였다. 실제 EC 센서를 사용한 실험에서도 유사한 성능을 보여, 실험적 이벤트 데이터 생성 방식의 유효성을 검증하였다.
복잡한 형상의 물체에 대한 제약된 그래스핑을 효율적으로 생성하는 방법을 제안한다. 이를 통해 양팔 조작 성능을 향상시킬 수 있다.
언어 수정을 통해 로봇 정책의 일반화 가능한 지식을 추출하고 검색하여 새로운 환경에서의 성능을 향상시킬 수 있다.
PreAfford는 점 단위 어포던스 표현과 릴레이 학습 접근법을 활용하여 다양한 환경과 물체 유형에 걸쳐 적응성을 높이는 새로운 사전 조작 계획 프레임워크를 제안한다.
이 논문은 접촉 동역학의 불확실성을 모델링하여 로버스트한 조작 행동을 합성하는 방법을 제안한다. 준정적 접촉 동역학을 활용하여 객체 구성의 분산을 예측하고, 이를 바탕으로 샘플링 기반 궤적 최적화 알고리즘을 통해 로버스트한 푸싱 궤적을 생성한다.
사전 학습된 언어 조건부 모방 학습 정책의 일반화 능력을 높이기 위해 모델 보정과 불확실성 인식 행동 선택 기법을 제안한다.