本文提出了一種基於強化學習的抗逆控制方法,用於解決離散時間線性系統在拒絕服務攻擊下的最優輸出調節問題。
首先,在沒有拒絕服務攻擊的情況下,建立了一個包含內部模型的增強系統,並設計了一個狀態反饋控制器來解決輸出調節問題。
接著,在考慮拒絕服務攻擊的情況下,分析了閉環系統的抗逆性,並給出了系統在拒絕服務攻擊下保持穩定的上界條件。
最後,提出了一種基於政策迭代的在線學習方法,能夠在拒絕服務攻擊下學習最優控制器。該方法只需要輸入-狀態數據,無需知道系統參數。通過仿真驗證了所提方法的有效性。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Sayan Chakra... lúc arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07766.pdfYêu cầu sâu hơn