Die Arbeit befasst sich mit dem Problem der risikogebundenen Trajektorienplanung für autonome mobile Agenten mit stochastischer, nichtlinearer Dynamik, die aus Daten gelernt werden muss, da keine geschlossene Darstellung der Dynamik bekannt ist.
Der Ansatz verwendet einen "Generate-and-Test"-Ansatz, bei dem ein Planer zunächst eine Kandidatentrajektorie unter Verwendung eines linearen Dynamikmodells erzeugt. Ein Validator bewertet dann das Risiko dieser Trajektorie, indem er Trajektorienproben um die Kandidatentrajektorie herum generiert und die Kollisionswahrscheinlichkeit mit Hindernissen berechnet. Wenn das Risiko den vorgegebenen Grenzwert überschreitet, berechnet der Validator eine zusätzliche Sicherheitseinschränkung, die an den Planer zurückgegeben wird, um die Kandidatentrajektorie in der nächsten Iteration zu verfeinern.
Um ein lineares Dynamikmodell für den Planer zu erhalten, verwenden die Autoren einen variationellen Autoencoder, um ein lineares Latent-Raum-Dynamikmodell zu lernen. Das Planungsproblem wird dann in den Latent-Raum übertragen, um effiziente konvexe Optimierungstechniken nutzen zu können. Die dekodierte Trajektorie aus dem Latent-Raum wird dann an den Validator übergeben.
Die Autoren zeigen, dass ihr Ansatz eine Größenordnung effizienter ist als der Stand der Technik bei der risikogebundenen Trajektorienplanung für nichtlineare stochastische Agenten, bei nur geringem Verlust an Optimalität und Sicherheit. Außerdem demonstrieren sie die Anwendung ihres Algorithmus auf Echtzeitdaten eines autonomen Quadrotors.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Marlyse Reev... om arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.07063.pdfDiepere vragen