核心概念
該文提出了一種新的學習方法,用於在非線性神經動態系統中學習可驗證的安全控制策略,同時最大限度地提高整體性能,並通過課程學習、增量驗證和初始狀態相關控制器等技術,成功地將可驗證的安全範圍擴展到比現有方法大一個數量級。
標題: 基於神經網路動態模型的可驗證安全強化學習
作者: Junlin Wu, Huan Zhang, Yevgeniy Vorobeychik
會議: 第 38 屆神經信息處理系統會議 (NeurIPS 2024)
本研究旨在解決在非線性神經動態系統中學習可驗證安全控制策略的挑戰,目標是訓練一個控制器,該控制器不僅可以憑經驗滿足決策時的安全性約束,還可以確保在最初的 K 步驟內經過驗證的安全性。