核心概念
逆最適制御問題の解決可能性を分析し、結論を導き出す。
摘要
この論文では、逆最適制御(IoC)問題の解決可能性に焦点を当て、2つの既存の最小原理法に基づいて分析されています。IoC問題がどのような軌道で真の報酬関数の重みを回復するかについて検証されました。特に、ハード制約法とソフト制約法におけるオリジナル最適制御問題の初期条件に依存するさまざまな種類の軌道に対してIoC問題がどれだけ解決可能かが分析されました。この研究は、第二次システムが高次システムの構成要素と見なされるため、第二次システムに焦点を当てました。
I. 導入
- IoCは未知コスト関数を学習するアプローチであり、自然な動きや人間・動物・鳥類の運動から生成されたものと仮定します。
- 最近では、ペナルティを課すことで目的を満たす重みが手動で調整されます。
II. 予備条件
- オリジナル最適制御問題におけるソフト・ハード制約IoC方法の予備条件がカバーされます。
III. IoC問題の解決可能性(一般非線形)
- ソフト・ハード制約IoC方法を使用した一般非線形IoC問題へ向けた解決可能性が取り上げられます。
IV. IoC問題の解決可能性(無限時間LTI)
- 無限時間LTI系でソフト・ハード制約IoC方法を使用した場合、その解決可能性が議論されます。
統計資料
KalmanはIOC問題を線形システム用に初めて述べました。
Mombaurは報酬関数特定するためバイレベルアプローチ提案しました。
引述
"IOC problem has been formulated as a control systems problem."
"Analytical results were validated via simulation."