Core Concepts
유연한 예측 모델 학습 기법인 DPMPB(Deep Predictive Model with Parametric Bias)를 통해 복잡한 관계와 시간에 따른 모델 변화를 다룰 수 있다.
Abstract
이 연구에서는 DPMPB(Deep Predictive Model with Parametric Bias)라는 예측 모델 학습 기법을 제안한다. DPMPB는 로봇의 몸체, 대상 물체, 도구, 환경 간의 복잡한 관계를 모델링하고 시간에 따른 모델 변화에 대응할 수 있다.
DPMPB는 센서 값 s와 액추에이터 값 u 간의 관계를 신경망으로 모델링한다. 이를 통해 복잡한 관계를 학습할 수 있다. 또한 매개변수 편향(Parametric Bias, PB)을 도입하여 시간에 따른 모델 변화를 내재적으로 표현할 수 있다. PB는 저차원 입력 변수로, 로봇의 몸체, 대상 물체, 도구, 환경 상태 변화를 반영한다. 온라인 학습을 통해 PB를 지속적으로 업데이트하면 현재 상태에 적응할 수 있다.
DPMPB는 상태 천이 모델(STM)과 제어 천이 모델(CTM) 두 가지 네트워크 구조를 가진다. STM은 현재 상태에서 다음 상태를 예측하고, CTM은 현재 상태에서 다음 제어 입력을 출력한다. 이를 통해 다양한 모델링 어려움과 시간에 따른 모델 변화에 대응할 수 있다.
구체적인 실험 사례로, 유연한 손 모델, 저강성 로봇의 시각 피드백, 바퀴 로봇의 안정적 제어 등을 다루었다. 이를 통해 DPMPB가 복잡한 관계와 시간에 따른 변화에 효과적으로 대응할 수 있음을 보였다.
Stats
유연한 손 모델 실험에서 접촉 센서 값 F의 예측 오차가 크게 증가하였다.
저강성 로봇 실험에서 관절 각도 오프셋 j1은 2도였다.
바퀴 로봇 실험에서 방 환경의 마찰 계수가 복도 환경보다 높았다.
Quotes
"DPMPB는 로봇의 몸체, 대상 물체, 도구, 환경 간의 복잡한 관계를 모델링하고 시간에 따른 모델 변화에 대응할 수 있다."
"PB는 저차원 입력 변수로, 로봇의 몸체, 대상 물체, 도구, 환경 상태 변화를 반영한다."
"온라인 학습을 통해 PB를 지속적으로 업데이트하면 현재 상태에 적응할 수 있다."