核心概念
本文提出了一種基於模型預測控制 (MPC) 的數據驅動模糊控制器合成框架,稱為模糊自回歸移動平均 (F-ARMA) 控制器,利用 MPC 數據訓練 ARMA 控制器,模擬 MPC 在不同條件下的響應,並透過 Takagi-Sugeno 模糊系統加權和插值所有已訓練 ARMA 控制器的響應,實現對原始 MPC 控制器約束響應的模擬。
摘要
研究論文摘要
書目資訊
Juan Augusto Paredes Salazar and Ankit Goel. (2024). MPC-guided, Data-driven Fuzzy Controller Synthesis. arXiv preprint arXiv:2410.06556v1.
研究目標
本研究旨在開發一種基於模型預測控制 (MPC) 的數據驅動模糊控制器合成框架,以解決 MPC 在資源受限系統中計算成本高的問題。
方法
研究提出了一種稱為模糊自回歸移動平均 (F-ARMA) 控制器的框架。該框架首先使用 MPC 閉環模擬數據訓練多個自回歸移動平均 (ARMA) 控制器,每個 ARMA 控制器模擬 MPC 在特定條件下的響應。然後,使用 Takagi-Sugeno (T-S) 模糊系統根據測量的系統條件對所有已訓練 ARMA 控制器的響應進行加權和插值,從而產生最終的 F-ARMA 控制器。
主要發現
數值算例表明,所提出的 F-ARMA 控制器能夠有效地模擬原始 MPC 控制器的約束響應,同時顯著降低了計算成本。
主要結論
基於 MPC 的數據驅動模糊控制器合成框架提供了一種有效的方法,可以在資源受限的系統中實現接近 MPC 性能的控制。 F-ARMA 控制器結合了 ARMA 控制器的簡單性和模糊系統的非線性逼近能力,使其成為模擬複雜 MPC 行為的有效解決方案。
意義
本研究為資源受限系統的先進控制策略的開發做出了貢獻。所提出的 F-ARMA 控制器有可能應用於各種需要低計算複雜度的控制任務。
局限性和未來研究方向
未來的研究方向包括在物理實驗中驗證 F-ARMA 框架,並利用模糊系統優化技術自動選擇模糊系統規則和隸屬函數參數。
統計資料
線性 MPC 的平均運行時間為每個步驟 1.1 × 10^-3 秒。
F-ARMA 的平均運行時間為每個步驟 8.2 × 10^-6 秒。
非線性 MPC 的平均運行時間為每個步驟 1.1 秒。
F-ARMA 在擺動控制中的平均運行時間為每個步驟 5.4 × 10^-5 秒。
引述
"MPC-guided control synthesis, also know as imitation learning, in which training data obtained from MPC closed-loop simulations is used to synthesize a low computational complexity controller that emulates the response of MPC, which usually take the form of neural networks [13]–[19]."
"The T-S fuzzy framework is chosen since it provides an intuitive methodology to interpolate the response of linear systems for control applications [21], [22]."