Core Concepts
이 연구는 매개변수 불확실성이 있는 비선형 유연 역진자 카트 시스템에서 다중 독립 및 시간 상관 확률적 교란을 능동적으로 제거하는 기술을 설명합니다.
Abstract
이 연구는 매개변수 불확실성이 있는 비선형 유연 역진자 카트 시스템에서 다중 독립 및 시간 상관 확률적 교란을 능동적으로 제거하는 기술을 제시합니다.
유연 역진자 카트 시스템 모델링:
다물체 접근법과 라그랑지안 운동 방정식을 사용하여 시스템 모델을 개발했습니다.
구조 감쇠와 마찰 감쇠를 레일레이 감쇠로 모델링했습니다.
독립적인 오르슈타인-우들렌벡 확률 프로세스를 사용하여 교란을 모델링했습니다.
5개의 매개변수에 대한 50%의 불확실성을 적용했습니다.
심층 강화 학습 제어:
연속 행위자-비평가 심층 Q-학습 알고리즘인 심층 결정론적 정책 경사(DDPG)를 사용했습니다.
상태 벡터, 행동(제어력), 보상 함수를 정의했습니다.
100,000 단계 동안 학습을 수행했습니다.
시뮬레이션 결과:
10,000회의 몬테카를로 시뮬레이션을 수행했습니다.
교란이 있는 경우 DDPG 제어기가 PD 제어기보다 우수한 성능을 보였습니다.
DDPG 제어기는 교란이 있는 상황에서도 진자 각도를 10도 이내로 유지할 수 있었습니다.
PD 제어기는 카트 속도 교란에 매우 취약했습니다.
Stats
진자 팁 각도의 최대값은 약 11도였습니다.
진자 중심 각도의 최대값은 약 10도였습니다.
DDPG 제어기의 평균 보상은 -212.35, 표준 편차는 105.79였습니다.
PD 제어기의 평균 보상은 -79,005.72, 표준 편차는 132,957.99였습니다.
Quotes
"이 연구는 매개변수 불확실성이 있는 비선형 동적 시스템에서 다중 독립 및 시간 상관 확률적 교란을 능동적으로 제거하는 기술을 제시합니다."
"DDPG 제어기는 교란이 있는 상황에서도 진자 각도를 10도 이내로 유지할 수 있었습니다."
"PD 제어기는 카트 속도 교란에 매우 취약했습니다."