Core Concepts
デモンストレーションを使用して自動的にフィードバックコントローラーを合成するアルゴリズムを提案し、厳密な収束と最適性結果を持つことを証明。
Abstract
この論文では、特定の初期状態から目標セットにシステムを誘導するコントローラーを合成するアルゴリズムが提案されています。デモンストレーターから得られた特定のタスクのデモンストレーションを使用して、フィードバックコントローラーがオフラインで学習されます。アルゴリズムは、収束と最適性の厳密な結果と共に効率的な実装を確認します。これにより、制御則の生成が大幅に容易化されます。
Quotes
"During this process, it maintains a certificate to reduce the simulation time needed in counterexample search."
"Assume that the demonstrator itself is unsuitable for direct (e.g., online) usage."
"We prove that under some mild assumptions, finitely many cycles of this loop generate a controller that steers the system into the goal set."