المفاهيم الأساسية
Wir präsentieren ein verbessertes Auto-Regressive-Modell namens Argus3D, das die Leistungsfähigkeit und Skalierbarkeit von 3D-Formgenerierungsmodellen gleichzeitig steigert.
الملخص
Der Beitrag umfasst Folgendes:
- Aufbau eines großen 3D-Datensatzes namens Objaverse-Mix durch Zusammenführen mehrerer öffentlich verfügbarer 3D-Datensätze. Der Datensatz umfasst etwa 900.000 diverse 3D-Objekte mit verschiedenen Eigenschaften wie Meshes, Punktwolken, Voxel, Renderings und Textbeschreibungen.
- Vorstellung eines neuartigen Auto-Regressiven-Modells namens Argus3D, das die Leistungsfähigkeit von 3D-Formgenerierung durch diskrete Repräsentationslernung in einem eindimensionalen Latenzraum anstelle von volumetrischen Gittern verbessert. Dies reduziert den Rechenaufwand und ermöglicht eine einfachere Modellierung der Abhängigkeiten.
- Skalierung des Argus3D-Modells auf 3,6 Milliarden Parameter, was die Qualität der 3D-Formgenerierung weiter verbessert.
- Umfangreiche Experimente auf vier Generierungsaufgaben, die zeigen, dass Argus3D diverse und realistische Formen über mehrere Kategorien hinweg synthetisieren kann und dabei hervorragende Leistung erzielt.
الإحصائيات
Die Verarbeitung des Objaverse-Mix-Datensatzes erforderte den Einsatz von vier Maschinen mit jeweils 64-Kern-CPUs und 8 A100-GPUs über einen Zeitraum von vier Wochen sowie fast 100 TB Speicherplatz.
Der Objaverse-Mix-Datensatz umfasst etwa 900.000 3D-Objekte.
اقتباسات
"Wir präsentieren einen neuartigen Rahmen namens Argus3D, der nicht nur die oben genannten Einschränkungen beim Einsatz von Auto-Regressiven-Modellen für den 3D-Bereich beseitigt, sondern das Modell auch auf ein bisher unerreichtes Ausmaß von 3,6 Milliarden Parametern skaliert, um die Qualität der vielseitigen 3D-Formgenerierung weiter zu verbessern."
"Unser Argus3D-Modell kann diverse und realistische Formen über mehrere Kategorien hinweg synthetisieren und dabei hervorragende Leistung erzielen."