Die Studie präsentiert einen neuartigen Ansatz zur Robotersteuerung, der auf Gaussian-Process-Regression basiert. Durch die Kombination von On-Policy- und Off-Policy-Daten sowie die ausdrucksstarken Gaussian-Prozesse kann der Regler sich an die Komplexität verschiedener Umgebungen anpassen und so die Leistung von Robotern verbessern. Die Strategie ermöglicht eine nahtlose und echtzeitfähige Generierung von Steuereingaben, sodass der Gaussian-Prozess als Echtzeitregler fungieren und effiziente, informierte Entscheidungen treffen kann, um den Roboter durch unvorhersehbare Terrains und Umgebungen zu navigieren.
Die Autoren entwickeln zunächst einen On-Policy-Regler auf Basis der modellprädiktiven Regelung (MPC), der den Roboter auf Trajektorien führt und Hindernisse vermeidet. Während dieser Interaktionen werden relevante Daten gesammelt und gespeichert. Anschließend trainieren die Autoren einen Off-Policy-Gaussian-Prädiktionsregler (GPC) auf Basis dieser Daten, ohne das Robotermodell explizit zu verwenden. Sobald der GPC-Regler ausreichend gelernt hat, übernimmt er die Steuerung und ersetzt den MPC-Regler.
Die Simulationsergebnisse zeigen, dass der GPC-Regler die Leistung des MPC-Reglers in Bezug auf Trajektoriengenauigkeit und Hindernisavoidance entweder spiegelt oder übertrifft, was das Potenzial des vorgeschlagenen Ansatzes für die Erzielung einer optimalen Steuerung in komplexen Robotersystemen mit verbesserter Echtzeitfähigkeit unterstreicht.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問