Core Concepts
Dieser Artikel präsentiert einen Algorithmus zur Synthese einer formal verifizierten kontinuierlichen-Zeit-neuronalen Kontrollbarrierenfunktion (SNCBF) in stochastischen Umgebungen in einem einzigen Schritt. Der vorgeschlagene Trainingsprozess stellt die Wirksamkeit über den gesamten Zustandsraum mit nur einer endlichen Anzahl von Datenpunkten sicher, indem ein stichprobenbasierter Lernrahmen für SNCBF konstruiert wird.
Abstract
Der Artikel befasst sich mit der Synthese einer formal verifizierten kontinuierlichen-Zeit-neuronalen Kontrollbarrierenfunktion (SNCBF) in stochastischen Umgebungen.
Zunächst wird das Problem formuliert, bei dem das Ziel ist, eine SNCBF zu synthetisieren, die die Sicherheitsbedingungen über den gesamten Zustandsraum erfüllt. Dazu wird das ursprüngliche Problem als robustes Optimierungsproblem umformuliert und anschließend als Szenario-Optimierungsproblem gelöst.
Um die Lipschitz-Stetigkeit der SNCBF und ihrer Ableitungen zu gewährleisten, werden Bedingungen in Form von linearen Matrixungleichungen in den Trainingsprozess integriert. Dadurch kann die Gültigkeit der SNCBF über den gesamten Zustandsraum mit nur einer endlichen Anzahl von Datenpunkten sichergestellt werden.
Der Trainingsprozess umfasst die Minimierung mehrerer Verlustfunktionen, die die Erfüllung der Sicherheitsbedingungen, die Lipschitz-Stetigkeit und die Gültigkeit der SNCBF sicherstellen.
Die Effektivität des Ansatzes wird anhand von zwei Fallstudien demonstriert: dem invertierten Pendel und der Hindernisvermeidung eines autonomen Fahrzeugs. Die Ergebnisse zeigen, dass die trainierte SNCBF in der Lage ist, größere sichere Regionen zu identifizieren als Baseline-Methoden.
Stats
Die Zustandsdynamik des inversen Pendels ist gegeben durch:
d[θ, θ̇]⊤ = [θ̇, g/l sin(θ)]⊤ dt + [0, 1/(ml²)]⊤ u dt + σ dWt
mit m = 1 kg, l = 10 m und σ = diag(0,1, 0,1).
Die Zustandsdynamik des autonomen Fahrzeugs ist gegeben durch:
d[x₁, x₂, ψ]⊤ = [v cos ψ, v sin ψ, 0]⊤ dt + [0, 0, 1]⊤ u dt + σ dWt
mit v = 1 und σ = diag(0,1, 0,1, 0,1).
Quotes
"Dieser Artikel präsentiert einen Algorithmus zur Synthese einer formal verifizierten kontinuierlichen-Zeit-neuronalen Kontrollbarrierenfunktion (SNCBF) in stochastischen Umgebungen in einem einzigen Schritt."
"Der vorgeschlagene Trainingsprozess stellt die Wirksamkeit über den gesamten Zustandsraum mit nur einer endlichen Anzahl von Datenpunkten sicher, indem ein stichprobenbasierter Lernrahmen für SNCBF konstruiert wird."