Core Concepts
本論文では、線形二次最適制御(LQR)問題に対して、モーメンタム項と再起動ルールを用いた高速最適化フレームワークを提案する。状態フィードバックLQR(SLQR)問題に対しては、ネステロフ最適収束速度を持つ連続時間ハイブリッドダイナミクスシステムを導入し、その離散化アルゴリズムを提案する。出力フィードバックLQR(OLQR)問題に対しては、半凸関数最適化と負の曲率の利用からなる2段階アルゴリズムを提案し、ϵ-定常点を高速に見つけることができることを示す。
Abstract
本論文は、線形二次最適制御(LQR)問題に対する高速最適化手法を提案している。
まず、状態フィードバックLQR(SLQR)問題に対して以下の結果を示す:
LQR性能関数がヘッシアンリップシッツ連続であることを示す。これは高速最適化アルゴリズムの収束性解析に重要な性質である。
モーメンタム項と再起動ルールを組み合わせたハイブリッドダイナミクスシステムを提案し、その解が指数関数的に最適フィードバックゲインに収束することを示す。
提案したハイブリッドダイナミクスシステムを離散化したアルゴリズムを提案し、ネステロフ最適収束速度を達成することを示す。
次に、出力フィードバックLQR(OLQR)問題に対して以下の結果を示す:
半凸関数最適化と負の曲率の利用からなる2段階アルゴリズムを提案する。
提案アルゴリズムがϵ-定常点を高速に見つけられることを示す。さらに、得られる定常点が2次の最適性を満たすことを示す。
全体として、本論文は LQR問題に対する高速最適化手法を初めて提案したものであり、理論的な貢献が大きい。
Stats
LQR性能関数は、ある有界な部分集合上でヘッシアンリップシッツ連続である。
SLQR問題の最適化アルゴリズムは、ネステロフ最適収束速度 1 - 1/√κ を達成する。
OLQR問題の最適化アルゴリズムは、ϵ-定常点をO(ϵ^(-7/4)log(1/ϵ))の時間で見つけることができる。
Quotes
"LQR is a landmark problem in the field of optimal control, which is the concern of this paper."
"We introduce for the first time an accelerated optimization framework of handling the LQR problem, and give its convergence analysis for the cases of SLQR and OLQR, respectively."
"For the OLQR problem, a Hessian-free accelerated framework is proposed, which is a two-procedure method consisting of semiconvex function optimization and negative curvature exploitation."