Die Studie präsentiert eine neue Übertragbarkeitsmetrik für DRL-Navigationsalgorithmen, die auf der Ähnlichkeit zwischen Trainings- und Testszenen basiert. Es werden zwei Indikatoren für die Szenensimilarität entwickelt: die globale Szenensimilarität, die die allgemeine Robustheit des DRL-Algorithmus bewertet, und die lokale Szenensimilarität, die als Sicherheitsmaß dient, wenn ein DRL-Agent ohne globale Karte eingesetzt wird.
Darüber hinaus wird ein DRL-Navigationsalgorithmus vorgeschlagen, der eine lokale Karte als Beobachtung verwendet, die 2D-LiDAR-Daten, die Position des Agenten und die Position des Ziels fusioniert. Dies soll die Übertragbarkeit von DRL-Navigationsalgorithmen verbessern.
Sowohl Simulations- als auch Realweltexperimente mit einem Radroboter in insgesamt 26 verschiedenen Szenen bestätigen die Robustheit des Entwurfs der lokalen Kartenbeobachtung und zeigen eine starke Korrelation zwischen der Szenensimilaritätsmetrik und der Erfolgsquote der DRL-Navigationsalgorithmen.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor