ReCaLaB ist ein vollständig differenzierbares Pipeline-System, das hochwertige 3D-Menschenmodelle aus nur einem RGB-Videoinput erstellt. Der Kern des Ansatzes ist eine deformierbare neuronale Strahlungsfeld-Darstellung (NeRF), die den menschlichen Körper in einer kanonischen T-Pose volumetrisch repräsentiert. Darauf aufbauend wird eine viewpoint-unabhängige neuronale Textur-Darstellung gelernt, die diffuse Farbe und Beleuchtungskorrektur entkoppelt. Dies ermöglicht die gezielte Manipulation von Körperform, Textur und Beleuchtung durch Textbefehle. Umfangreiche Experimente zeigen, dass ReCaLaB die Bildqualität bisheriger monokularer Ansätze übertrifft und sogar multiview-Methoden überlegen ist, obwohl es nur mit einem Bruchteil der Trainingsdaten auskommt. Die vollständige Differenzierbarkeit des Pipelines ermöglicht zudem eine intuitive Steuerung der Avatare durch natürlichsprachliche Beschreibungen.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yuchen Rao,E... lúc arxiv.org 03-26-2024
https://arxiv.org/pdf/2312.04784.pdfYêu cầu sâu hơn