Core Concepts
本論文では、サイバーフィジカルシステムおよびロボットシステムの文脈で頻繁に発生する確率的最適化問題を解決するための新しい勾配ベースのオンライン最適化フレームワークを提案する。提案手法は、システム動特性の近似モデルを学習プロセスに組み込み、モデリング誤差の影響を定量的に分析する。
Abstract
本論文は以下の内容で構成されている:
序論では、オンライン学習の概要と従来研究の課題を説明する。特に、サイバーフィジカルシステムへの適用において、勾配情報の取得が困難であることを指摘する。
問題設定では、サイバーフィジカルシステムの動特性を制約条件として組み込んだ確率的最適化問題を定式化する。提案するオンライン最適化アルゴリズムは、勾配降下法とクアシニュートン法を包含する。収束性解析では、モデリング誤差の影響を定量的に評価する。
アルゴリズムの解釈では、提案手法をトラストリージョン法の観点から説明する。
サイバーフィジカルシステムとの接続では、フィードフォワードとフィードバック制御の統合を示し、閉ループシステムにおける勾配計算を導出する。
数値実験では、柔軟ビーム、4脚歩行ロボット、ピンポン打ちロボットなどのサイバーフィジカルシステムに提案手法を適用し、その有効性を検証する。
Stats
損失関数 l(y; ζ) = 1/2 |G(s0, u; ζ) - yref|2
入力 u = πff(ωff; ζ) + πfb(ωfb; y - ζ)
出力 y = G(s0, u; ζ)