ReCaLaB ist ein vollständig differenzierbares Pipeline-System, das hochwertige 3D-Menschenmodelle aus nur einem RGB-Videoinput erstellt. Der Kern des Ansatzes ist eine deformierbare neuronale Strahlungsfeld-Darstellung (NeRF), die den menschlichen Körper in einer kanonischen T-Pose volumetrisch repräsentiert. Darauf aufbauend wird eine viewpoint-unabhängige neuronale Textur-Darstellung gelernt, die diffuse Farbe und Beleuchtungskorrektur entkoppelt. Dies ermöglicht die gezielte Manipulation von Körperform, Textur und Beleuchtung durch Textbefehle. Umfangreiche Experimente zeigen, dass ReCaLaB die Bildqualität bisheriger monokularer Ansätze übertrifft und sogar multiview-Methoden überlegen ist, obwohl es nur mit einem Bruchteil der Trainingsdaten auskommt. Die vollständige Differenzierbarkeit des Pipelines ermöglicht zudem eine intuitive Steuerung der Avatare durch natürlichsprachliche Beschreibungen.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Yuchen Rao,E... um arxiv.org 03-26-2024
https://arxiv.org/pdf/2312.04784.pdfTiefere Fragen