Die Studie präsentiert eine neue Übertragbarkeitsmetrik für DRL-Navigationsalgorithmen, die auf der Ähnlichkeit zwischen Trainings- und Testszenen basiert. Es werden zwei Indikatoren für die Szenensimilarität entwickelt: die globale Szenensimilarität, die die allgemeine Robustheit des DRL-Algorithmus bewertet, und die lokale Szenensimilarität, die als Sicherheitsmaß dient, wenn ein DRL-Agent ohne globale Karte eingesetzt wird.
Darüber hinaus wird ein DRL-Navigationsalgorithmus vorgeschlagen, der eine lokale Karte als Beobachtung verwendet, die 2D-LiDAR-Daten, die Position des Agenten und die Position des Ziels fusioniert. Dies soll die Übertragbarkeit von DRL-Navigationsalgorithmen verbessern.
Sowohl Simulations- als auch Realweltexperimente mit einem Radroboter in insgesamt 26 verschiedenen Szenen bestätigen die Robustheit des Entwurfs der lokalen Kartenbeobachtung und zeigen eine starke Korrelation zwischen der Szenensimilaritätsmetrik und der Erfolgsquote der DRL-Navigationsalgorithmen.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Shiwei Lian,... om arxiv.org 04-15-2024
https://arxiv.org/pdf/2306.04910.pdfDiepere vragen