Die Studie präsentiert einen Ansatz zur lokalen Pfadplanung in Umgebungen mit verschiebbaren Objekten, der auf tiefem Verstärkungslernen basiert. Der Ansatz ermöglicht es Robotern, Hindernisse auf nicht-lineare Weise zu verschieben und sich an unvorhergesehene Änderungen in der Objektdynamik anzupassen.
Der Schlüssel ist ein neuronales Netzwerk, das als Funktionsapproximator dient. Es kombiniert Informationen aus einem Gitter und einem Vektor, um eine Strategie für die Aktionsauswahl und eine Schätzung des Erwartungswertes zu generieren. Das Netzwerk wird in einer physikbasierten Simulationsumgebung trainiert, in der mehrere Agenten parallel lernen.
Das Training nutzt einen Curriculum-Ansatz, bei dem die Schwierigkeit der Szenarien schrittweise erhöht wird. Außerdem wird Domänenrandomisierung eingesetzt, um die Robustheit des Modells gegenüber Sensorungenauigkeiten und unvorhersehbaren Objektdynamiken zu verbessern.
Die Ergebnisse zeigen, dass der Ansatz in der Lage ist, effiziente Pfade in bekannten Umgebungen mit neuen Objektpositionen sowie in völlig unbekannten Umgebungen zu finden. Darüber hinaus wurde die Leistungsfähigkeit des Modells auch in realen Roboterexperimenten unter Beweis gestellt.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Linghong Yao... às arxiv.org 03-15-2024
https://arxiv.org/pdf/2303.02407.pdfPerguntas Mais Profundas