Core Concepts
Ein neuartiger datengetriebener Online-Adaptive-Regelungsalgorithmus für unbekannte lineare Systeme.
Abstract
Das Papier untersucht die Herausforderung der adversativen Online-Regelung für unbekannte lineare Systeme. Es präsentiert einen datengetriebenen Algorithmus, der auf dem Verhalten von Systemen basiert, um eine nicht-parametrische Systemdarstellung zu erlernen und eine adaptive Regelung zu ermöglichen. Der Algorithmus garantiert eine sublineare Regret-Grenze und kann auf Systeme mit Ausgangsrückkopplung erweitert werden.
Abstract:
Untersuchung der Online-Regelung mit unbekanntem linearen dynamischen System und adversativen Störungen.
Präsentation eines datengetriebenen Online-Adaptive-Regelungsalgorithmus.
Garantierte sublineare Regret-Grenze und Erweiterung auf Ausgangsrückkopplung.
Introduction:
Anstieg der Beliebtheit datengetriebener Regelungsansätze.
Datengetriebene Regelung umgeht Identifikation von Systemparametern.
Einfachheit, Allgemeingültigkeit und Robustheit der datengetriebenen Regelung.
Problem Formulation and Preliminaries:
Online-Regelungsproblem mit unbekanntem LTI-System und adversativen Störungen.
Verwendung von Hankel-Matrizen zur nicht-parametrischen Systemdarstellung.
Darstellung des Systems in einem L-Schritt-Modell.
Algorithm Design:
Zwei Stufen: Online-Exploration und Engagement in einer rauschigen Umgebung.
Adaptive ADAC-Politik zur Regelung des Systems.
Verwendung von Online-Gradientenabstieg zur Aktualisierung der Parameter.
Theoretical Analysis:
Analyse der Regret-Grenze des Algorithmus.
Zerlegung des Regrets in verschiedene Teile.
Abschließende Regret-Grenze von ˜O(T 2/3).
Stats
Wir betrachten den Online-Regelungsprozess mit unbekanntem linearen dynamischen System.
Der Algorithmus garantiert eine sublineare Regret-Grenze.
Die Erweiterung auf Systeme mit Ausgangsrückkopplung wird diskutiert.
Quotes
"Unsere Methode garantiert eine sublineare Regret-Grenze mit hoher Wahrscheinlichkeit."
"Der Algorithmus kann direkt auf Fälle mit Ausgangsrückkopplung angewendet werden."