Core Concepts
본 연구에서는 H-Infinity 제어 이론을 활용하여 강화학습 기반의 강인한 보행 제어 기법을 제안한다. 이를 통해 로봇이 다양한 외부 교란에 대해 안정적으로 보행할 수 있도록 한다.
Abstract
본 연구는 강화학습 기반의 보행 제어 기법에 H-Infinity 제어 이론을 접목하여 강인성을 향상시키는 방법을 제안한다. 기존 방법들은 단순한 도메인 랜덤화를 통해 강인성을 높이려 했지만, 이는 충분한 교란 저항 능력을 보장하지 못했다.
본 연구에서는 학습 과정을 행위자(actor)와 교란기(disturber) 간의 적대적 상호작용으로 모델링한다. 행위자는 누적 보상을 최대화하는 반면, 교란기는 과업 보상과 오라클 간 오차를 최대화하도록 최적화된다. H-Infinity 제약을 통해 행위자와 교란기의 안정적인 최적화를 보장한다. 이를 통해 로봇은 점점 복잡한 물리적 교란에 대처할 수 있는 능력을 습득한다.
제안 기법을 Unitree Aliengo 및 Unitree A1 로봇에 적용하여 평가했다. 시뮬레이션 결과, 제안 기법이 기존 방법 대비 강인성이 향상되었음을 확인했다. 또한 실제 로봇 실험에서도 다양한 교란 상황에서 안정적인 보행을 수행할 수 있음을 보였다.
Stats
제안 기법은 기존 방법 대비 연속적인 외력에 대한 강인성이 향상되었다.
제안 기법은 기존 방법 대비 갑작스러운 큰 외력에 대한 강인성이 향상되었다.
제안 기법은 기존 방법 대비 의도적인 교란에 대한 강인성이 향상되었다.
Quotes
"본 연구에서는 학습 과정을 행위자(actor)와 교란기(disturber) 간의 적대적 상호작용으로 모델링한다."
"H-Infinity 제약을 통해 행위자와 교란기의 안정적인 최적화를 보장한다."