Core Concepts
Eine neuronale inverse Renderingtechnik, die Geometrie, Albedo und Rauheit aus Bildern einer Szene mit co-lokalisierter Licht- und Kameraanordnung rekonstruieren kann, indem globale Beleuchtung und Nahfeldeffekte implizit modelliert werden.
Abstract
Die Studie präsentiert GaNI, ein neuronales inverses Renderingverfahren, das Geometrie, Albedo und Rauheitsparameter aus Bildern einer Szene mit co-lokalisierter Licht- und Kameraanordnung rekonstruieren kann. Bestehende inverse Renderingverfahren mit co-lokalisierter Licht-Kamera-Anordnung konzentrieren sich nur auf einzelne Objekte und modellieren keine globale Beleuchtung und Nahfeldbeleuchtung, die in Szenen mit mehreren Objekten stärker ausgeprägt sind.
Das vorgeschlagene Verfahren löst dieses Problem in zwei Stufen: Zunächst wird die Geometrie mithilfe des neuronalen volumetrischen Renderings NeuS rekonstruiert, gefolgt von inverser neuronaler Radiometrie NeRad, die die zuvor vorhergesagte Geometrie verwendet, um Albedo und Rauheit zu schätzen.
Allerdings scheitert eine solche naive Kombination, und es werden mehrere technische Beiträge vorgeschlagen, die diesen zweistufigen Ansatz ermöglichen. Es wird beobachtet, dass NeuS Probleme mit Nahfeldbeleuchtung und starken Spiegelreflexionen vom Blitzlicht in einer Szene hat. Es wird vorgeschlagen, die Auswirkungen der Nahfeldbeleuchtung implizit zu modellieren und eine Oberflächenwinkel-Verlustfunktion einzuführen, um Spiegelreflexionen zu behandeln. Ähnlich dazu wird beobachtet, dass NeRad eine konstante Beleuchtung während der Aufnahme annimmt und keine beweglichen Blitzlichter während der Aufnahme handhaben kann. Daher wird ein lichtpositionsabhängiges Radiance-Cache-Netzwerk und zusätzliche Glättungspriors für die Rauheit vorgeschlagen, um die Reflektanz zu rekonstruieren.
Die experimentelle Auswertung an synthetischen und realen Daten zeigt, dass die vorgeschlagene Methode die bestehenden co-lokalisierten Licht-Kamera-basierten inversen Renderingtechniken übertrifft. Der Ansatz produziert deutlich bessere Reflektanz und leicht bessere Geometrie als Aufnahmestrategien, die keinen Dunkelraum erfordern.
Stats
Die Beleuchtungsintensität folgt der inversen quadratischen Regel mit zunehmender Entfernung vom Blitzlicht.
Die Sichtbarkeit der Oberfläche vom Blitzlicht aus wird durch eine Indikatorfunktion dargestellt.
Die Blitzlichtintensität wird als E_flash bezeichnet.
Der Abstand zwischen Blitzlicht und Oberfläche wird als d bezeichnet.
Quotes
"Wir beobachten, dass NeuS Probleme mit Nahfeldbeleuchtung und starken Spiegelreflexionen vom Blitzlicht in einer Szene hat."
"Ähnlich dazu wird beobachtet, dass NeRad eine konstante Beleuchtung während der Aufnahme annimmt und keine beweglichen Blitzlichter während der Aufnahme handhaben kann."