Core Concepts
Eine neuartige Methode zur Modellierung menschlicher Avatare, die eine gemeinsame Darstellung mit RGB-texturiertem Mesh und Gaussian-Splatting verwendet. Dies ermöglicht eine signifikante Reduzierung der Anzahl der Gaussians und des erforderlichen Speicherplatzes für Avatare, ohne Qualitätseinbußen.
Abstract
Die Studie präsentiert einen neuartigen Ansatz zur Erzeugung fotorealistischer, animierbarer menschlicher Avatare aus monokularen Videoaufnahmen. Der Kerngedanke ist es, die Vorteile von Gaussian-Splatting und texturiertem Mesh-Modell zu kombinieren, um eine effizientere Darstellung zu erreichen.
In der ersten Phase wird ein vollständiger Gaussian-basierter Avatar trainiert, indem die SMPL-X-Parameter optimiert werden. In der zweiten Phase wird ein texturiertes SMPL-X-Mesh gelernt, das die Oberfläche des Körpers darstellt. In der dritten Phase wird dann gelernt, welche Gaussians entfernt werden können, ohne die Qualität zu beeinträchtigen. Dafür wird eine differenzierbare Renderingpipeline entwickelt, die Gaussians und Mesh kombiniert.
Die Experimente zeigen, dass HAHA die Leistung des aktuellen Stands der Technik auf dem SnapshotPeople-Datensatz erreicht, während es deutlich weniger Gaussians verwendet. Auf dem herausfordernden X-Humans-Datensatz übertrifft HAHA die Wettbewerber sowohl quantitativ als auch qualitativ, insbesondere bei der Animation hochgradig artikulierter Körperteile wie Finger.
Stats
Die Methode reduziert die Anzahl der Gaussians um mehr als das Dreifache im Vergleich zu vorherigen Ansätzen, was zu einer Reduzierung des Speicherbedarfs um mehr als das Zweifache führt.
Quotes
"HAHA joint optimiert ein Gaussian-Splatting-Modell mit einem texturierten Mesh, um die photometrische Qualität der Avatare zu verbessern."
"Die Methode filtert überflüssige Gaussians auf eine lernbare, unüberwachte Art und Weise heraus."