핵심 개념
본 논문에서는 적응형 안전 중요 제어 상황에서 온라인 파라미터 추정 및 불확실성 정량화를 위한 프레임워크를 제시한다. 연속 시간 재귀 최소 제곱(RLS) 알고리즘을 통해 얻은 파라미터 추정치가 초기 추정치에 대한 선형 변환이라는 핵심 통찰을 바탕으로, 이러한 추정치를 선형 변환에 대해 폐쇄적인 객체(예: 조노토프)로 매개변수화하여 시간에 따른 불확실성 전파를 효율적으로 수행할 수 있다.
초록
본 논문은 적응형 안전 중요 제어 상황에서 온라인 파라미터 추정 및 불확실성 정량화를 위한 프레임워크를 제시한다.
-
재귀 최소 제곱(RLS) 알고리즘을 기반으로 한 온라인 파라미터 추정:
- RLS 알고리즘의 핵심 통찰: 특정 시점의 파라미터 추정치가 초기 추정치에 대한 선형 변환이라는 점
- 이를 활용하여 선형 변환에 대해 폐쇄적인 객체(예: 조노토프)로 추정치를 매개변수화하고, 시간에 따른 불확실성 전파를 효율적으로 수행
-
불확실성 정량화:
- 초기 추정치를 포함하는 조노토프를 사용하여 시간에 따른 파라미터 추정의 불확실성 범위 계산
- 이를 통해 적응형 제어 바리어 함수(aCBF)를 활용한 안전 중요 제어기 합성 가능
-
예시를 통한 접근법의 효용성 입증
통계
파라미터 추정 오차 ∥˜θ(t)∥2의 상한 바운드:
∥˜θ(t)∥2 ≤ γ2e−βt∥P(ˆθ0 − θ)∥2 + γ2 ¯w/β
여기서 ¯w는 Φ(t)⊤W(t)의 상한값