Unser Ansatz ermöglicht die effiziente Synthese und Verbesserung neuartiger Ansichten aus Schwachlichtaufnahmen mit heterogener Helligkeit, indem er die Aufnahmen in Reflexion, Beleuchtung und Rauschen zerlegt und eine intuitive Bearbeitung der Beleuchtungskomponente ermöglicht.
Unser Ansatz DecentNeRF ermöglicht die Erstellung fotorealistischer 3D-Szenenrepräsentationen aus crowdsourced Bildern, indem er die Berechnung zwischen Benutzern und Server verteilt und so den unerwünschten Zugriff des Servers auf persönliche Inhalte minimiert.
Unser Ansatz DecentNeRF ist der erste Versuch, dezentralisierte, crowdsourced-basierte neuronale Strahlungsfelder (NeRFs) zu erstellen, die etwa 104-mal weniger Server-Rechenleistung für eine Szene benötigen als ein zentralisierter Ansatz. Anstatt die Rohdaten zu senden, erfordert unser Ansatz, dass Benutzer eine 3D-Darstellung senden, wodurch die hohen Rechenkosten für das Training zentralisierter NeRFs zwischen den Benutzern verteilt werden.
Unser Verfahren ermöglicht die effektive Rekonstruktion von 3D-Gaussian-Avataren aus Monovideos, indem es die Genauigkeit der Ganzkörperpose verbessert und eine oberflächengeführte Neuzuordnung der Gaussians verwendet, um eine stabile Darstellung in neuen Posen zu erreichen.
Unser Ansatz GF-NeRF verwendet eine zweistufige Architektur (global und fokussiert) und eine global-geführte Trainingsstrategie, um hochwertige Darstellungen großer Szenen zu erzielen. Die globale Stufe erfasst eine kontinuierliche Darstellung der gesamten Szene, während die fokussierte Stufe die Szene in mehrere Blöcke unterteilt und diese mit eigenen Unter-Encodern weiter verarbeitet. Durch diese zweistufige Architektur müssen die Unter-Encoder nur noch feinabgestimmt werden, basierend auf dem globalen Encoder, was die Trainingskomplexität in der fokussierten Stufe reduziert, während die Konsistenz der gesamten Szene beibehalten wird.
Unser Ansatz GauMesh kombiniert die Stärken von 3D-Gaußschen und Dreiecksnetzen, um komplexe Geometrien und detaillierte Texturen in dynamischen Szenen effizient darzustellen.
Der Kern der Arbeit ist die Ableitung einer analytischen Approximation des Gaußschen Integrals innerhalb des Pixel-Fensterbereichs, um die Intensitätsantwort jedes Pixels genauer zu erfassen und so Aliasing-Artefakte zu vermeiden sowie Details besser zu bewahren.
Durch die Verwendung einer analytischen Approximation des Gaußschen Integrals innerhalb des Pixelfensterbereichs kann Analytic-Splatting die Aliasing-Probleme von 3D Gaussian Splatting (3DGS) überwinden und gleichzeitig Details besser erfassen.
Ctrl123 ist eine geschlossene Transkriptions-basierte Methode zur Synthese neuartiger Ansichten, die die Konsistenz zwischen den generierten Ansichten und den Referenzansichten deutlich verbessert.
Ein neuartiges generatives Framework, das hochwertige und geometrisch konsistente Bildgenerierung von Objektansichten aus einer einzelnen Eingabe ermöglicht, indem es Geometrieinformationen in den Diffusionsprozess integriert.