Latent-Raum-Planung für stochastische Systeme: Effiziente risikogebundene Trajektorienoptimierung für Agenten mit gelernter Dynamik
Wir stellen einen "Generate-and-Test"-Ansatz zur risikogebundenen Planung vor, bei dem ein Planer eine Kandidatentrajektorie unter Verwendung eines linearen Dynamikmodells erzeugt und ein Validator die Risiken der Trajektorie bewertet, um zusätzliche Sicherheitseinschränkungen für den Planer zu berechnen. Wir verwenden einen variationellen Autoencoder, um ein lineares Latent-Raum-Dynamikmodell zu lernen und das Planungsproblem in den Latent-Raum zu übertragen, um effiziente konvexe Optimierungstechniken zu nutzen.