본 연구는 복잡한 제어기의 행동을 신경망 제어기로 모방하는 문제를 다룬다. 이를 위해 다음과 같은 접근법을 제안한다:
구체적으로, 먼저 제어 요구사항을 모수화된 STL(PSTL) 형식으로 표현한다. 이를 통해 제어기 성능을 정량적으로 평가할 수 있는 척도를 정의한다.
다음으로, 반례 생성 도구를 활용하여 현재 신경망 제어기가 만족하지 못하는 상태를 찾아내고, 이 상태에서 기존 제어기의 행동을 관찰하여 새로운 학습 데이터를 생성한다.
또한 상태 공간 커버리지를 고려하여 데이터를 수집함으로써, 신경망 제어기의 일반화 성능을 높인다.
이러한 접근법을 통해 복잡한 제어기의 행동을 효과적으로 모방하는 신경망 제어기를 학습할 수 있음을 비행 로봇 사례 연구를 통해 보여준다.
他の言語に翻訳
原文コンテンツから
arxiv.org
抽出されたキーインサイト
by Thao... 場所 arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16593.pdf深掘り質問