핵심 개념
본 논문은 도달-회피 문제와 같은 제약 제어 문제에 사용할 수 있는 조화 제어 Lyapunov 장벽 함수(harmonic CLBF)를 소개한다. 조화 CLBF는 조화 함수가 만족하는 최대 원리를 활용하여 CLBF의 특성을 인코딩한다. 이를 통해 샘플 궤적에 기반한 학습 없이도 실험 초기에 CLBF를 정의할 수 있다. 제어 입력은 시스템 동역학과 조화 CLBF의 최대 하강 방향 사이의 내적을 최대화하도록 선택된다. 다양한 도달-회피 환경에서의 수치 실험 결과는 조화 CLBF가 안전 영역 진입 위험을 크게 낮추고 목표 영역 진입 확률을 높임을 보여준다.
초록
본 논문은 안전 중요 시스템을 위한 제약 최적 제어 문제를 다룬다. 특히 도달-회피 문제, 즉 목표 상태에 도달하면서 안전하지 않은 상태를 회피하는 문제를 다룬다.
기존 연구에서는 도달 가능성과 회피 가능성을 각각 인증하는 두 개의 인증서를 사용했지만, 이는 제어 정책에 상충을 초래할 수 있다. 이를 해결하기 위해 본 논문은 도달 가능성과 안전성을 단일 인증서인 제어 Lyapunov 장벽 함수(CLBF)로 통합한다.
구체적으로, 본 논문은 조화 함수의 최대 원리를 활용하여 CLBF의 특성을 인코딩한 조화 CLBF를 제안한다. 조화 CLBF는 샘플 궤적에 기반한 학습 없이도 실험 초기에 정의될 수 있다는 장점이 있다. 제어 입력은 시스템 동역학과 조화 CLBF의 최대 하강 방향 사이의 내적을 최대화하도록 선택된다.
수치 실험 결과, 제안된 조화 CLBF 기반 접근법은 기존 방법에 비해 안전 영역 진입 위험을 크게 낮추고 목표 영역 진입 확률을 높이는 것으로 나타났다.
통계
안전 영역 진입 위험이 0인 경우가 많았으며, 목표 영역에 도달하는 데 걸리는 평균 시간은 약 50-450 시간 정도였다.