Core Concepts
Das vorgeschlagene Robot-centric Implicit Mapping (RIM) Verfahren ermöglicht eine effiziente, skalierbare und hochwertige implizite Kartierung großer Umgebungen durch den Einsatz einer roboterzentrierten lokalen Karte, einer flexiblen globalen Karte und einer Bündelüberwachung zur Verbesserung der Kontinuität und Robustheit.
Abstract
Das RIM-Verfahren kombiniert eine hybride Darstellung, die Formen mit impliziten Merkmalen über eine mehrstufige Voxelkarte codiert und Abstandsfelder (SDF) durch ein flaches MLP decodiert. Es verwendet eine roboterzentrierte lokale Karte, um die Effizienz des Modelltrainings zu steigern und das katastrophale Vergessen zu verhindern. Eine entkoppelte, skalierbare globale Karte dient zum Archivieren und Abrufen erlernter Merkmale, um den konstanten Videospeicherverbrauch beizubehalten.
Die Bündelüberwachung nutzt historische Punkte innerhalb der lokalen Karte, um eine mehrfache Ansichtsüberwachung und Ausreißerentfernung zu erreichen, was zu einer hochwertigen Rekonstruktion und der Abschwächung des Einflusses von dynamischen Objekten führt. Die Experimente zeigen, dass RIM eine hervorragende Qualität, Effizienz und Anpassungsfähigkeit über verschiedene Skalen und Szenarien hinweg aufweist.
Stats
Die Rekonstruktionsgenauigkeit (Acc.) unseres Ansatzes beträgt 1,12 cm, 0,93 cm, 0,99 cm, 1,06 cm, 0,83 cm, 1,01 cm, 0,85 cm und 0,94 cm für die 8 Szenen des Replica-Datensatzes.
Die Vollständigkeit (Comp.) unseres Ansatzes beträgt 8,61 cm, 7,49 cm, 3,78 cm, 2,45 cm, 2,65 cm, 2,26 cm, 2,14 cm und 3,09 cm für die 8 Szenen des Replica-Datensatzes.
Auf dem MaiCity-Datensatz beträgt die Rekonstruktionsgenauigkeit (Acc.) unseres Ansatzes 2,167 cm und die Vollständigkeit (Comp.) 0,958 cm.
Quotes
"RIM generiert Abstandsfelder (SDF) in Echtzeit basierend auf den bereitgestellten positionierten Punkten."
"Die vorgeschlagene Bündelüberwachung ist eher wie Punktwolkenregistrierung als schlüsselbildbasierte Methoden, da sie Punktstrahlen anstelle von Ansichtseinstellungen zur Einschränkung der erlernten Merkmale mit Mehrfachansichten verwendet."