核心概念
Wir präsentieren eine effiziente neuronale 3D-Rekonstruktionsmethode, die speziell für kurze egozentrische omnidirektionale Videosequenzen entwickelt wurde. Die Geometrie wird unter Verwendung eines Signed-Distance-Fields und einer neuartigen adaptiven sphärischen Binoctree-Datenstruktur geschätzt, die durch iterative Optimierung unterteilt wird. Wir zeigen, dass unsere Methode andere state-of-the-art-3D-Rekonstruktionsmethoden in Bezug auf die Balance zwischen Details und Speicherkosten übertrifft.
要約
Die Studie präsentiert eine neuartige Methode zur 3D-Rekonstruktion großer, unbegrenzter Außenszenen aus kurzen omnidirektionalen Videosequenzen. Im Gegensatz zu herkömmlichen Methoden, die auf perspektivischen Kameras basieren, verwendet der Ansatz eine omnidirektionale Kamera, um eine umfassende räumliche Erfassung der Umgebung zu ermöglichen.
Die Kernideen sind:
- Eine voxelgeführte Abtastung mit einem sphärisch geformten Raster, das den Rekonstruktionsraum unterteilt, um Speichereffizienz zu erreichen.
- Eine Online- und iterative Verfeinerung der Gitterstrukturen basierend auf den Zwischenergebnissen.
Der Ansatz verwendet ein adaptives sphärisches Binoctree-Gitter, um den Raum effizient zu unterteilen und die Abtastung auf Bereiche mit mehr Details zu konzentrieren. Im Gegensatz zu herkömmlichen Methoden, die auf Cartesischen Gittern basieren, ist das sphärische Binoctree-Gitter besser an die Kameraanordnung angepasst und ermöglicht eine bessere Speicher-Qualitäts-Abwägung.
Die Leistungsfähigkeit des Ansatzes wird durch quantitative und qualitative Vergleiche mit klassischen und neuronalen Oberflächenrekonstruktionsmethoden demonstriert. Die Ergebnisse zeigen, dass unser Verfahren die Genauigkeit klassischer Methoden erreicht und gleichzeitig die Detailgenauigkeit neuronaler Methoden übertrifft, insbesondere in komplexen Außenszenen.
統計
Die Anzahl der Voxel in jeder Szene für ein kartesisches Unterteilungsgitter ist deutlich größer als in unserem adaptiven Sphoxel-Gitter. Unser Verfahren ist deutlich effizienter, während es immer noch hohe Detailgenauigkeit in den rekonstruierten Ergebnissen erreicht.
Szene
Methode
Anzahl der Voxel
Minimale Sphoxel-Größe
Sponza
Dichtes reguläres Gitter
33.335.054.331
Unsere Methode
4.346.041
1,25e-10
Lone-monk
Dichtes reguläres Gitter
2.234.638.740
Unsere Methode
231.237
1,87e-9
San Miguel
Dichtes Gitter
1.953.273.076
Unsere Methode
951.703
2,14e-9
引用
Keine relevanten Zitate gefunden.