toplogo
ลงชื่อเข้าใช้

無限ホライズン非線形制御問題への最適解決法


แนวคิดหลัก
非線形システムの無限ホライズン最適制御問題に対する正則化された解決法を提案し、端末セットへの有効な転送問題を示す。
บทคัดย่อ
この論文は、非線形システムの無限ホライズン最適制御問題に焦点を当てています。主なアプローチは、有限時間の最適転送問題を通じて端末セットに安定性をもたらすことです。さらに、近似が真の最適無限ホライズンコストに収束することが示されます。論文は以下の構造で構成されています: 導入: 最適制御問題の目的と背景 理論: 無限ホライズン最適制御問題へのアプローチとその解決方法 関連研究: 近似動的計画法や強化学習など他の手法と比較した結果 提案手法: 直接的なHJB方程式へのアプローチとその優位性 実験結果: 車両型ロボットや水泳者モデルなどで行われた実験結果と分析
สถิติ
無限ホライズンコスト関数は端末セット内で収束する。 非線形システムではCLFがグローバル安定性を提供する。 有効なポリシー/値関数が高い信頼度で得られるADPメソッドが使用される。
คำพูด
"我々は直接的なHJB方程式へのアプローチを取り、それが提案手法において重要であることを示しています。" "近年、深層ニューラルネットワークを用いた関数近似が強化学習アルゴリズムの性能向上に大きく貢献しています。"

ข้อมูลเชิงลึกที่สำคัญจาก

by Mohamed Nave... ที่ arxiv.org 03-26-2024

https://arxiv.org/pdf/2403.16979.pdf
An Optimal Solution to Infinite Horizon Nonlinear Control Problems

สอบถามเพิ่มเติม

どうしてAC-OCPを提案したのか?

AC-OCPを提案する目的は、IH-OCPの本質を捉えることです。問題では、システムがターミナルセットに挿入されるための転送時間を決定する必要があります。この転送時間は固定されているのではなく、初期状態によって異なります。また、AC-OCP構築は、有限な最適時間コスト関数がCLFであることを保証し、セットΩM をグローバル漸近的に安定化します。

この手法はNonlinear MPCとどう異なるか

Nonlinear MPCと比較して、AC-OCPは異なるアプローチです。従来の非線形MPCは固定ホライズンNを持ち、同じ固定ホライズンで再計画します。これにより、「時不変」制御則だけが漸近的に安定化させられる領域内へ導きます。一方で私たちは任意の初期条件から自由ホライゾン上で問題を解決しました。これが結果として得られたポリシーがGAS性質である理由です。

初期条件によって転送時間が異なることから何が推測されるか

初期条件ごとに転送時間T(ΩM) 依存性から推測されることは次の通りです。 初期条件ごとに最適な転送時間(T(ΩM))が異なります。 システム全体では第1打点まで増加した場合でも,トータル有限地平面コスト(JT∞(x))実質的に収束します。 異なった初期条件対応する場合,それぞれ別々の移動回数 T(ΩM) の観察可能性も示唆されています。
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star