toplogo
登入

針對受無界擾動影響的時變線性系統,遞迴可行隨機模型預測控制


核心概念
本論文提出了一種針對具有時變系統矩陣和無界擾動的系統,確保凸、仿射回饋隨機模型預測控制問題公式化的遞迴可行性的方法,並證明了該方法可以確保系統在實際運行中滿足期望的機率約束,並且可以將隨機模型預測控制問題公式化為凸規劃,從而可以實時有效地求解。
摘要
edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

文獻資訊: Knaup, J. W., & Tsiotras, P. (2024). Recursively Feasible Stochastic Model Predictive Control for Time-Varying Linear Systems Subject to Unbounded Disturbances. arXiv preprint arXiv:2410.11107. 研究目標: 本文旨在解決具有時變系統矩陣和無界擾動的線性系統的隨機模型預測控制 (SMPC) 中的遞迴可行性問題。 方法: 本文提出了一種基於協方差導引隨機模型預測控制 (CS-SMPC) 的方法,通過設計終端約束集和終端協方差矩陣,以確保 SMPC 問題的遞迴可行性。 主要發現: 本文證明了所提出的方法可以確保系統在閉環運行期間滿足期望的機率約束。 本文證明了所提出的方法可以將隨機模型預測控制問題公式化為凸規劃,從而可以實時有效地求解。 主要結論: 本文提出的方法為具有時變系統矩陣和無界擾動的線性系統的 SMPC 提供了一種實用的解決方案,確保了遞迴可行性和機率約束的滿足。 論文貢獻: 本文的主要貢獻在於: 針對具有無界擾動的時變線性系統,提出了一種新的確保 SMPC 遞迴可行性的方法。 證明了所提出的方法可以確保系統在實際運行中滿足期望的機率約束。 證明了所提出的方法可以將 SMPC 問題公式化為凸規劃,從而可以實時有效地求解。 限制和未來研究方向: 本文僅考慮線性時變系統,未來可以將該方法推廣到非線性系統。 本文假設系統狀態是完全可觀測的,未來可以考慮部分可觀測系統的情況。
統計資料
本文使用了一個車輛橫向控制的例子,其中車輛的縱向速度範圍為 1.0 到 20.0 米/秒,路徑曲率範圍為 -0.025 到 0.025。 車輛狀態約束為:方向盤角度在 -π/4 到 π/4 弧度之間,航向誤差在 -π/4 到 π/4 弧度之間,橫向誤差在 -2 到 2 米之間。 車輛控制輸入約束為:方向盤轉速在 -1 到 1 弧度/秒之間。

深入探究

如何將本文提出的方法應用於具有狀態和輸入約束的非線性系統?

將本文提出的方法應用於具有狀態和輸入約束的非線性系統,主要挑戰在於如何處理非線性系統的模型預測控制問題。以下列出幾種可能的方法: 線性化: 最直接的方法是將非線性系統線性化,並將本文提出的方法應用於線性化後的系統。具體來說,可以在每個時間步長將非線性系統在當前狀態和控制輸入處進行線性化,得到一個時變線性系統。然後,可以使用本文提出的方法設計時變線性系統的遞迴可行隨機模型預測控制器。這種方法的優點是簡單易行,但缺點是線性化誤差可能會影響控制性能,特別是在非線性程度較高的情況下。 非線性模型預測控制: 更精確的方法是直接使用非線性模型預測控制(NMPC)來處理非線性系統。NMPC 通常需要求解非凸優化問題,這在計算上更具挑戰性。為了確保遞迴可行性,可以採用類似於本文提出的方法,設計合適的終端約束集和終端成本函數。然而,由於非線性系統的複雜性,設計這些約束和成本函數可能會更加困難。 反饋線性化: 對於某些非線性系統,可以通過反饋線性化技術將其轉換為等效的線性系統。然後,可以將本文提出的方法應用於等效的線性系統。這種方法的優點是可以利用線性系統控制理論的成熟方法,但缺點是並非所有非線性系統都能進行反饋線性化。 基於學習的方法: 近年來,基於學習的方法,例如強化學習,在非線性系統控制中取得了顯著的成功。可以將本文提出的方法與強化學習相結合,設計遞迴可行的隨機模型預測控制器。例如,可以使用強化學習方法來學習非線性系統的不確定性模型,並將其用於設計更精確的模型預測控制器。 總之,將本文提出的方法應用於具有狀態和輸入約束的非線性系統需要克服一些挑戰,但通過採用適當的方法,例如線性化、非線性模型預測控制、反饋線性化或基於學習的方法,可以設計出有效的遞迴可行隨機模型預測控制器。

如果系統狀態只有部分可觀測,如何修改本文提出的方法來確保遞迴可行性?

當系統狀態只有部分可觀測時,需要對本文提出的方法進行修改以確保遞迴可行性。主要修改包括以下幾個方面: 狀態估計: 由於無法直接觀測到完整的系統狀態,需要使用狀態估計器來估計不可觀測的狀態。常用的狀態估計器包括卡爾曼濾波器、粒子濾波器等。卡爾曼濾波器適用於線性系統,而粒子濾波器適用於非線性系統。 基於置信度的約束: 由於狀態估計存在不確定性,需要將狀態約束轉換為基於置信度的約束。例如,可以將狀態約束 Pr(α⊤ x,ixk ≤βx,i) ≥1 −px,i 修改為 Pr(α⊤ x,iˆxk ≤βx,i - ε) ≥1 −px,i,其中 ˆxk 是狀態估計值,ε 是根據狀態估計誤差協方差矩陣確定的置信度邊界。 擴展狀態空間: 可以將狀態估計誤差作為新的狀態變量,擴展系統的狀態空間。然後,可以在擴展的狀態空間中設計遞迴可行的隨機模型預測控制器。這種方法的優點是可以直接處理狀態估計誤差,但缺點是會增加系統的維數,提高計算複雜度。 魯棒模型預測控制: 可以採用魯棒模型預測控制(RMPC)的方法來處理狀態估計誤差。RMPC 的目標是在滿足約束條件的情況下,找到一個對所有可能的狀態估計誤差都可行的控制策略。 總之,當系統狀態只有部分可觀測時,需要採用狀態估計、基於置信度的約束、擴展狀態空間或魯棒模型預測控制等方法來修改本文提出的方法,以確保遞迴可行性。

本文提出的方法如何應用於其他領域,例如機器人運動規劃或金融投資組合優化?

本文提出的遞迴可行隨機模型預測控制方法,除了應用於車輛橫向控制外,還可以推廣到其他需要處理不確定性和約束的領域,例如機器人運動規劃和金融投資組合優化。 機器人運動規劃: 場景: 機器人在未知環境中運動,需要避開障礙物並到達目標點。 挑戰: 環境感知存在不確定性,機器人運動學和動力學模型也可能存在誤差。 應用: 使用隨機模型預測控制方法,將環境感知的不確定性建模為隨機變量,並將機器人運動學和動力學模型的誤差考慮進去。 將避障約束和目標點約束轉換為狀態約束,並使用基於置信度的約束來處理不確定性。 設計遞迴可行的隨機模型預測控制器,在確保機器人安全性的同時,規劃出一條到達目標點的最優路径。 金融投資組合優化: 場景: 投資者希望在一定風險水平下,最大化投資組合的預期收益。 挑戰: 金融市場充滿不確定性,資產價格波动剧烈。 應用: 使用隨機模型預測控制方法,將資產價格的波动建模為隨機變量。 將投資者的風險偏好轉換為投資組合的風險約束,例如投資組合的方差或最大回撤。 設計遞迴可行的隨機模型預測控制器,在控制風險的同時,動態調整投資組合的配置,以期獲得更高的預期收益。 總結: 本文提出的遞迴可行隨機模型預測控制方法具有廣泛的應用前景,可以應用於各種需要處理不確定性和約束的領域。通過將該方法與特定領域的知識相結合,可以設計出更加高效、可靠的控制策略。
0
star