Das vorgestellte PLGSLAM-System adressiert die Herausforderungen bestehender neuronaler SLAM-Systeme bei der Skalierung auf große Innenräume und lange Videosequenzen.
Zunächst wird eine progressive Szenenrepräsentation eingeführt, bei der neue lokale Szenenrepräsentationen dynamisch initialisiert werden, wenn sich die Kamera außerhalb des aktuellen Bereichs bewegt. Dies ermöglicht eine skalierbare Darstellung großer Innenräume und erhöht die Robustheit gegenüber Fehlschätzungen.
In der lokalen Szenenrepräsentation wird eine Kombination aus Tri-Planes und Multi-Layer-Perzeptron-Netzen verwendet, um eine genaue und glatte Oberflächenrekonstruktion sowie Auffüllung unbeobachteter Bereiche zu erreichen.
Darüber hinaus wird ein lokale-zu-globale Bündelausgleichsverfahren vorgestellt, das die traditionellen SLAM-Methoden mit einem End-to-End-Posenschätzungsnetzwerk kombiniert. Dadurch werden die wachsenden kumulativen Fehler in großen Innenräumen effektiv reduziert und eine robuste und genaue Kameraposenschätzung ermöglicht.
Umfangreiche Experimente zeigen, dass PLGSLAM den aktuellen Stand der Technik bei der Oberflächenrekonstruktion, Tiefenschätzung und Posenschätzung in großen Innenräumen übertrifft.
翻譯成其他語言
從原文內容
arxiv.org
深入探究