المفاهيم الأساسية
본 연구는 데이터 기반 예측 반복 제어(DeePRC) 알고리즘을 제안한다. DeePRC는 이전 반복의 데이터를 활용하여 성능을 향상시키고 최적 비용에 수렴하는 직접 데이터 기반 접근법이다. 또한 안전한 탐색을 위한 두 단계 접근법과 탐색 과정을 최적화에 통합한 일체형 접근법을 제시한다.
الملخص
본 논문은 데이터 기반 예측 반복 제어(DeePRC) 알고리즘을 소개한다. DeePRC는 선형 시불변(LTI) 시스템의 반복 작업을 위한 직접 데이터 기반 접근법이다.
- 입력-출력 볼록 안전 집합(ioCS)을 정의하여 이전 안전 궤적들을 활용한다. ioCS는 제어 불변성과 비용 감소 성질을 가진다.
- 명목 DeePRC 알고리즘은 ioCS와 종단 비용 함수를 활용하여 반복적으로 최적 제어 입력을 계산한다. 이는 재귀적 실행 가능성, 점근적 안정성, 비용 감소, 최적 수렴을 보장한다.
- 안전한 탐색을 위해 튜브 기반 DeePRC 기법을 제안한다. 이는 좌측 커널 기반 입력 교란 설계를 통해 정보가 풍부한 궤적을 생성하여 예측 수평을 확장한다.
- 입력 교란 설계를 최적화에 통합한 일체형 접근법을 제시한다. 이는 계산 복잡도가 증가하지만 성능이 향상된다.
- 제안된 알고리즘의 폐루프 특성과 수렴 특성을 이론적으로 분석한다.
- 수치 실험을 통해 제안 기법의 효과를 입증한다.
الإحصائيات
시스템 행렬 A, B, C, D는 다음과 같다:
A = [1 0 0.1 0; 0 1 0 0.1; 0 0 1 0; 0 0 0 1]
B = [0.1 0 0 0.1; 0 0.1 0.1 0]
C = [1 0 0 0; 0 1 0 0]
D = 0
입력 제약 U = [-1.5, 1.5]^2, 출력 제약 Y = [-1.5, 1.5]^2
초기 상태 (uS, yS) = ([0 0]^T, [0 0]^T), 목표 상태 (uF, yF) = ([0 0]^T, [0.4 -0.4]^T)
비용 행렬 Q = I4, R = 0.1 * I2
원하는 예측 수평선 N̄ = 50
اقتباسات
"본 연구는 데이터 기반 예측 반복 제어(DeePRC) 알고리즘을 제안한다. DeePRC는 이전 반복의 데이터를 활용하여 성능을 향상시키고 최적 비용에 수렴하는 직접 데이터 기반 접근법이다."
"튜브 기반 DeePRC 기법을 제안하여 안전한 탐색을 수행한다. 이는 좌측 커널 기반 입력 교란 설계를 통해 정보가 풍부한 궤적을 생성하여 예측 수평을 확장한다."
"입력 교란 설계를 최적화에 통합한 일체형 접근법을 제시한다. 이는 계산 복잡도가 증가하지만 성능이 향상된다."