Core Concepts
Eine neuartige Methode zum Erlernen eines Neuronalen Netzwerks (NN), das das Verhalten eines komplexen Reglers nachahmt, der Anforderungen in Signaltemporaler Logik (STL) erfüllt. Die Lernmethode verwendet eine effiziente Datenaggregation basierend auf Gegenbeispielen und einer Abdeckungsmessung, um die Leistung des gelernten Reglers zu verbessern.
Abstract
Die Arbeit präsentiert einen Ansatz zum Erlernen eines Neuronalen Netzwerks (NN), das das Verhalten eines komplexen Reglers nachahmt, der Anforderungen in Signaltemporaler Logik (STL) erfüllt.
Der Kern der Methode ist:
- Formalisierung der Leistungsbewertung für Lerner- und Expertenpolitiken unter Verwendung ihrer Fähigkeiten, Anforderungen in parametrischer temporaler Logik (PSTL) zu erfüllen.
- Nutzung von Werkzeugen zur Falsifizierung temporaler Logik, um relevante Trainingsdaten zu erstellen.
- Neues Verfahren zur Datenaggregation, um eine gute Leistung des NN in Bezug auf Imitation und Generalisierung zu gewährleisten.
Der Ansatz wird anhand einer Fallstudie mit einem fliegenden Roboter demonstriert. Die Ergebnisse zeigen, dass nach nur wenigen Iterationen ein NN-Regler erlernt werden kann, der die Leistung des nominalen Reglers erreicht.
Stats
Die Norm des Ausgangssignals y sollte weniger als s betragen, während der Zeitraum τ nicht überschritten wird.
Die Norm des Ausgangssignals y sollte nach einer Übergangszeit von höchstens τtr Sekunden für mindestens τst Sekunden kleiner als sst sein.
Quotes
"Wir präsentieren eine neuartige Methode für das Imitation Learning von Regelungsanforderungen, die in Signaltemporaler Logik (STL) ausgedrückt werden."
"Das Lernen wird durch eine effiziente Datenaggregation auf der Grundlage von Gegenbeispielen und einer Abdeckungsmessung geleitet."