核心概念
Omni-Recon ist ein allzweck-neuronales Strahlungsfeld, das sowohl eine verallgemeinerbare 3D-Rekonstruktion als auch ein nullstelliges Multitask-Szenenverständnis sowie Anpassungsfähigkeit an diverse 3D-Anwendungen ermöglicht.
摘要
Omni-Recon ist ein Framework, das ein allzweck-neuronales Strahlungsfeld (NeRF) mit einer bildbasierten Rendering-Pipeline entwickelt. Das Modell hat zwei entkoppelte Zweige: einen komplexen Transformer-basierten Zweig, der Geometrie- und Erscheinungsmerkmale schrittweise fusioniert, um eine genaue Geometrieschätzung zu erreichen, und einen leichtgewichtigen Zweig zur Vorhersage von Blendgewichten der Quellansichten.
Diese Architektur ermöglicht:
- Spitzenleistungen bei der verallgemeinerbaren 3D-Oberflächenrekonstruktion
- Nullstelliges Multitask-Szenenverständnis durch Wiederverwendung der Blendgewichte
- Anpassungsfähigkeit an diverse 3D-Anwendungen wie Echtzeitrendering und textgesteuerte Szenenbearbeitung
Der Schlüssel ist, dass die bildbasierte Rendering-Pipeline mit genauer Geometrie- und Erschätzung die 2D-Bildmerkmale in ihre 3D-Gegenstücke überführen kann, wodurch 2D-Aufgaben auf die 3D-Welt übertragen werden können.
統計資料
Die durchschnittliche Chamfer-Distanz unseres Omni-Recon-Modells auf 15 Testszenen des DTU-Datensatzes beträgt 1,10, was einen neuen Spitzenstand darstellt.
Ohne Feinabstimmung erreicht unser Echtzeitrendering-Pipeline bereits eine PSNR von 40,82, die nach nur 10 Sekunden Feinabstimmung auf 25,68 ansteigt und den stärksten Baseline-Wert übertrifft.
Nach einer einminütigen Feinabstimmung erreicht unser Modell eine PSNR von 28,34, was eine Verbesserung von +2,75 gegenüber dem stärksten Baseline-Modell darstellt.
引述
"Omni-Recon ist ein allzweck-neuronales Strahlungsfeld, das sowohl eine verallgemeinerbare 3D-Rekonstruktion als auch ein nullstelliges Multitask-Szenenverständnis sowie Anpassungsfähigkeit an diverse 3D-Anwendungen ermöglicht."
"Der Schlüssel ist, dass die bildbasierte Rendering-Pipeline mit genauer Geometrie- und Erschätzung die 2D-Bildmerkmale in ihre 3D-Gegenstücke überführen kann, wodurch 2D-Aufgaben auf die 3D-Welt übertragen werden können."