本文主要貢獻如下:
提出了一種基於對數障礙的平滑化方法,可以在理論上實現最優的平滑度和誤差折衷。這種平滑化方法可以保持原始控制器的穩定性。
證明了對數障礙 MPC 的梯度Hessian矩陣的上界為O(1/√η+d2−d),其中d是無約束解到邊界的距離。這表明對數障礙 MPC 在某個方向上是最優平滑器。
提出了一個新的關於凸 Lipschitz 函數的分析中心最優性差距的下界結果,這可能對優化領域有獨立的興趣。
通過實驗驗證了對數障礙 MPC 優於隨機平滑化。
總的來說,本文提出了一種新的平滑化方法,在理論和實踐上都優於隨機平滑化,為模仿學習提供了更好的專家控制器。
翻譯成其他語言
從原文內容
arxiv.org
深入探究