المفاهيم الأساسية
본 논문에서는 비선형 신경망 동적 시스템에서 검증 가능한 안전 제어 정책을 학습하는 새로운 접근 방식을 제안하며, 이는 유한-수평 도달 가능성 증명의 의미에서 안전성을 달성하고, 전체 성능을 극대화하는 것을 목표로 합니다.
Wu, J., Zhang, H., & Vorobeychik, Y. (2024). Verified Safe Reinforcement Learning for Neural Network Dynamic Models. Advances in Neural Information Processing Systems, 38.
본 연구는 비선형 신경망 동적 시스템에서 안전이 검증된 제어 정책을 학습하는 동시에 효율성을 극대화하는 것을 목표로 합니다. 특히, 유한 단계 동안의 안전성을 수학적으로 검증하면서도 높은 성능을 유지하는 제어기를 학습하는 데 중점을 둡니다.