POLICEd RL ist ein neuartiger RL-Algorithmus, der darauf ausgelegt ist, affine harte Beschränkungen in Echtzeit mit einer Black-Box-Umgebung durchzusetzen. Der Schlüssel ist es, die gelernte Politik so zu gestalten, dass sie in einer Pufferregion um den unsicheren Bereich herum affin ist, was die einfache Verifizierung der Beschränkungserfüllung ermöglicht.
Ein neuartiger Ansatz zur Vorhersage von Roboterkontaktkräften aus variablen Steifigkeitseingaben mittels iterativer Denoising-basierter Diffusionsmodelle, um die Kosten für Roboterversuche bei der Erlernung der variablen Impedanzsteuerung für kontaktreiche Aufgaben zu reduzieren.
Die Nichtlinearität dynamischer Systeme wird durch die Krümmung eines höherdimensionalen Euklidischen Raums, in den das System eingebettet ist, kodiert. Dies ermöglicht die Darstellung komplexer Bewegungen, die stabil und reaktiv sind, ohne Effizienz bei Training oder Stabilität zu opfern.
Die vorgeschlagene Off-Policy-Gaussian-Prädiktionsregelung ermöglicht eine effiziente und effektive Lösung von Optimalsteuerungsproblemen, indem sie die Optimierungsdynamik der modellprädiktiven Regelung durch Gaussian-Process-Regression lernt und nachbildet.
Die vorgeschlagene Off-Policy-Gaussian-Prädiktionsregelung ermöglicht eine effiziente und effektive Lösung von Optimalsteuerungsproblemen, indem sie die Optimierungsdynamik der modellprädiktiven Regelung durch Gaussian-Process-Regression lernt und nachbildet.
Der Artikel präsentiert einen neuartigen verteilten Abdeckungsregler für ein Mehrfachsystem mit Konstantgeschwindigkeits-Einrad-Robotern (CSUR). Der Regler löst die Probleme der herkömmlichen Methoden, indem er harte zustands- und eingangsbezogene Beschränkungen berücksichtigt und die Machbarkeit für Mehrfach-CSUR-Systeme sicherstellt.
Eine neue Methode zur Berechnung einer passiven, hierarchischen Steuerung, die eine beliebige Anzahl von Gleichheits- und Ungleichheitsaufgaben mit unterschiedlichen Prioritäten berücksichtigt.
Eine neuartige geometrische modellprädiktive Regelung (GMPC) wird vorgestellt, um die Trajektorienver- folgung von Mobilen Robotern mit Rädern effizient zu lösen. Dabei werden sowohl die Mannigfaltigkeits- bedingung der Roboterkonfiguration als auch die kinematische Bedingung des Roboters berücksichtigt.