Die Studie präsentiert eine neue Übertragbarkeitsmetrik für DRL-Navigationsalgorithmen, die auf der Ähnlichkeit zwischen Trainings- und Testszenen basiert. Es werden zwei Indikatoren für die Szenensimilarität entwickelt: die globale Szenensimilarität, die die allgemeine Robustheit des DRL-Algorithmus bewertet, und die lokale Szenensimilarität, die als Sicherheitsmaß dient, wenn ein DRL-Agent ohne globale Karte eingesetzt wird.
Darüber hinaus wird ein DRL-Navigationsalgorithmus vorgeschlagen, der eine lokale Karte als Beobachtung verwendet, die 2D-LiDAR-Daten, die Position des Agenten und die Position des Ziels fusioniert. Dies soll die Übertragbarkeit von DRL-Navigationsalgorithmen verbessern.
Sowohl Simulations- als auch Realweltexperimente mit einem Radroboter in insgesamt 26 verschiedenen Szenen bestätigen die Robustheit des Entwurfs der lokalen Kartenbeobachtung und zeigen eine starke Korrelation zwischen der Szenensimilaritätsmetrik und der Erfolgsquote der DRL-Navigationsalgorithmen.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Shiwei Lian,... klokken arxiv.org 04-15-2024
https://arxiv.org/pdf/2306.04910.pdfDypere Spørsmål