Das vorgestellte PLGSLAM-System adressiert die Herausforderungen bestehender neuronaler SLAM-Systeme bei der Skalierung auf große Innenräume und lange Videosequenzen.
Zunächst wird eine progressive Szenenrepräsentation eingeführt, bei der neue lokale Szenenrepräsentationen dynamisch initialisiert werden, wenn sich die Kamera außerhalb des aktuellen Bereichs bewegt. Dies ermöglicht eine skalierbare Darstellung großer Innenräume und erhöht die Robustheit gegenüber Fehlschätzungen.
In der lokalen Szenenrepräsentation wird eine Kombination aus Tri-Planes und Multi-Layer-Perzeptron-Netzen verwendet, um eine genaue und glatte Oberflächenrekonstruktion sowie Auffüllung unbeobachteter Bereiche zu erreichen.
Darüber hinaus wird ein lokale-zu-globale Bündelausgleichsverfahren vorgestellt, das die traditionellen SLAM-Methoden mit einem End-to-End-Posenschätzungsnetzwerk kombiniert. Dadurch werden die wachsenden kumulativen Fehler in großen Innenräumen effektiv reduziert und eine robuste und genaue Kameraposenschätzung ermöglicht.
Umfangreiche Experimente zeigen, dass PLGSLAM den aktuellen Stand der Technik bei der Oberflächenrekonstruktion, Tiefenschätzung und Posenschätzung in großen Innenräumen übertrifft.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Tianchen Den... a las arxiv.org 04-01-2024
https://arxiv.org/pdf/2312.09866.pdfConsultas más profundas