Core Concepts
本論文では、非線形動力学と安全制約を考慮しつつ、未知環境下でのエリア被覆制御問題を解決する手法を提案する。階層的な枠組みと能動的学習を組み合わせることで、エージェントの探索と利用のバランスを取りながら、最適な被覆を実現する。
Abstract
本論文では、エリア被覆制御問題に取り組む際の2つの主要な課題に取り組む。
非線形動力学と安全制約を考慮しつつ、最適な被覆を実現すること
当初未知の環境を探索しながら、最適な被覆を実現すること
提案手法は以下の2つのアプローチから成る:
階層的アプローチ:
中央サーバーで最適な参照軌道を計算し、各エージェントの局所的な非線形予測制御器に渡す
未知環境下では、探索と利用のバランスを取るための確率的な意思決定を導入
一体型アプローチ:
参照軌道の最適化を予測制御問題に統合
上限信頼区間(UCB)アプローチに基づく能動的学習を行う
両アプローチとも、安全性と再帰的実行可能性を保証しつつ、最適な被覆構成に収束することが理論的に示される。また、実機実験により、提案手法の有効性が確認される。
Stats
各エージェントの非線形動力学は、リプシッツ連続であり、状態と入力の制約を満たす。
密度関数ϕは、既知の特徴量の線形結合で表現される。
密度関数の推定には、ベイズ線形回帰を用いる。