이 연구는 강화 학습 정책의 안전성과 해석 가능성을 향상시키기 위해 VERINTER라는 새로운 방법을 제안한다. VERINTER는 마르코프 의사결정 과정(MDP)과 확률적 계산 트리 논리(PCTL)를 사용하여 강화 학습 정책의 안전성을 정확하게 검증한다. 또한 신경망 가지치기 기법을 통해 정책의 핵심 연결과 입력 특성이 안전성에 미치는 영향을 분석할 수 있다.
실험 결과, VERINTER는 다양한 강화 학습 환경에서 안전성을 유지하면서도 불필요한 연결을 제거할 수 있음을 보여준다. 특히 입력 특성 가지치기를 통해 안전성에 중요한 특성을 식별할 수 있다. 이를 통해 강화 학습 정책의 안전성과 해석 가능성을 향상시킬 수 있다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Dennis Gross... ב- arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10218.pdfשאלות מעמיקות