Die Studie präsentiert eine neue Übertragbarkeitsmetrik für DRL-Navigationsalgorithmen, die auf der Ähnlichkeit zwischen Trainings- und Testszenen basiert. Es werden zwei Indikatoren für die Szenensimilarität entwickelt: die globale Szenensimilarität, die die allgemeine Robustheit des DRL-Algorithmus bewertet, und die lokale Szenensimilarität, die als Sicherheitsmaß dient, wenn ein DRL-Agent ohne globale Karte eingesetzt wird.
Darüber hinaus wird ein DRL-Navigationsalgorithmus vorgeschlagen, der eine lokale Karte als Beobachtung verwendet, die 2D-LiDAR-Daten, die Position des Agenten und die Position des Ziels fusioniert. Dies soll die Übertragbarkeit von DRL-Navigationsalgorithmen verbessern.
Sowohl Simulations- als auch Realweltexperimente mit einem Radroboter in insgesamt 26 verschiedenen Szenen bestätigen die Robustheit des Entwurfs der lokalen Kartenbeobachtung und zeigen eine starke Korrelation zwischen der Szenensimilaritätsmetrik und der Erfolgsquote der DRL-Navigationsalgorithmen.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Shiwei Lian,... alle arxiv.org 04-15-2024
https://arxiv.org/pdf/2306.04910.pdfDomande più approfondite