모델 기반 강화 학습 및 모델 예측 제어 기법은 데이터 효율성, 설명 가능성, 안전성 측면에서 개선이 필요하다. 이를 위해 환경의 물리적 특성을 활용하면 이러한 문제를 해결할 수 있다.
본 연구는 신호 시간 논리(STL) 사양을 사용하여 복잡한 제어기의 행동을 모방하는 신경망 제어기를 학습하는 새로운 방법을 제안한다. 이를 위해 반례 기반 데이터 수집과 커버리지 측정을 활용하여 효율적인 학습을 달성한다.
선형 매개변수 변화 동적 시스템(LPV-DS)은 교란에 강건하고 전역적으로 점근적으로 안정적인 반응적 엔드이펙터 제어를 가능하게 한다. 본 연구에서는 LPV-DS 프레임워크를 확장하여 위치와 자세를 통합적으로 다룰 수 있는 SE(3) LPV-DS를 제안한다.
접촉 불확실성을 고려하여 0차 확률론적 비선형 모델 예측 제어 기법을 개발하였으며, 이를 통해 제약 조건을 만족하는 안정적인 보행 궤적을 생성할 수 있다.
본 논문은 로봇 상태 제약 조건을 보장하는 폐루프 제어 정책을 학습하는 새로운 강화학습 프레임워크 POLICEd RL을 제안한다. POLICEd RL은 상태 공간 주변에 완충 영역을 만들어 제약 조건을 만족하도록 정책을 학습한다.
탈노이즈 확산 모델을 이용하여 변수 강성 입력으로부터 로봇 접촉 궤적을 예측하는 새로운 접근법을 제안한다.
연속적 도메인 무작위화(CDR)는 도메인 무작위화와 지속적 학습을 결합하여 시뮬레이션에서 순차적으로 무작위화 매개변수의 부분 집합을 학습함으로써 시뮬레이션-실제 전이를 향상시킨다.
MORALS는 자동 인코딩 신경망과 모스 그래프를 결합하여 데이터 효율적으로 고차원 로봇 제어기의 원하는 및 원하지 않는 행동의 끌개와 그 영역을 발견한다.
제안된 기하학적 접근법은 로봇 제어를 위한 비선형 동적 시스템을 학습하며, 이를 통해 공간 곡률 내 비선형성을 인코딩한다.
알 수 없는 물체를 운반하는 휠 휴머노이드 로봇의 새로운 평형점을 데이터 기반 모델을 통해 신속하게 추정하여 모델 기반 제어기의 성능을 향상시킴