Core Concepts
非線形システムの無限ホライズン最適制御問題に対する正則化された解決法を提案し、端末セットへの有効な転送問題を示す。
Abstract
この論文は、非線形システムの無限ホライズン最適制御問題に焦点を当てています。主なアプローチは、有限時間の最適転送問題を通じて端末セットに安定性をもたらすことです。さらに、近似が真の最適無限ホライズンコストに収束することが示されます。論文は以下の構造で構成されています:
導入: 最適制御問題の目的と背景
理論: 無限ホライズン最適制御問題へのアプローチとその解決方法
関連研究: 近似動的計画法や強化学習など他の手法と比較した結果
提案手法: 直接的なHJB方程式へのアプローチとその優位性
実験結果: 車両型ロボットや水泳者モデルなどで行われた実験結果と分析
Stats
無限ホライズンコスト関数は端末セット内で収束する。
非線形システムではCLFがグローバル安定性を提供する。
有効なポリシー/値関数が高い信頼度で得られるADPメソッドが使用される。
Quotes
"我々は直接的なHJB方程式へのアプローチを取り、それが提案手法において重要であることを示しています。"
"近年、深層ニューラルネットワークを用いた関数近似が強化学習アルゴリズムの性能向上に大きく貢献しています。"