Linnk AI letöltése
•
Önálló Kutatási Asszisztens
>
Bejelentkezés
betekintés
-
강력한 정책 학습을 위한 해석 가능한 해밀턴-자코비 도달가능성 기반 교란
강력한 정책 학습을 위한 해석 가능한 해밀턴-자코비 도달가능성 기반 교란
본 연구는 모델 기반 제어 원리와 적대적 강화학습 훈련을 통합하여 외부 블랙박스 적대자 없이도 강건성을 향상시키는 새로운 강건 정책 훈련 프레임워크를 제안한다.
1