Core Concepts
Sketch3D generiert realistische 3D-Vermögenswerte mit einer Form, die mit der Eingabe-Skizze übereinstimmt, und einer Farbe, die mit der Textbeschreibung übereinstimmt.
Abstract
Sketch3D ist ein innovatives Framework, das darauf abzielt, realistische 3D-Vermögenswerte zu erzeugen, deren Form mit der Eingabe-Skizze übereinstimmt und deren Farbe mit der Textbeschreibung übereinstimmt.
Zunächst wird ein referenzbild durch einen formerhaltenden Bildgenerierungsprozess aus der Eingabe-Skizze und dem Textprompt erstellt. Dann wird eine grobe 3D-Gaußsche Voreinstellung aus dem Referenzbild abgeleitet. Anschließend werden mehrere stilkonsistente Führungsbilder aus verschiedenen Blickwinkeln unter Verwendung von IP-Adapter generiert. Schließlich werden drei Optimierungsstrategien vorgeschlagen: eine strukturelle Optimierung mit einem Verteilungstransfermechanismus, eine Farboptimierung mit einer einfachen MSE-Verlustfunktion und eine Skizzenähnlichkeitsoptimierung mit einem CLIP-basierten geometrischen Ähnlichkeitsverlust.
Umfangreiche qualitative und quantitative Experimente zeigen, dass Sketch3D nicht nur überzeugende Erscheinungen und Formen aufweist, sondern auch genau mit der gegebenen Skizze und dem Textprompt übereinstimmt.
Stats
Die Generierung des 3D-Vermögenswerts dauert etwa 3 Minuten.
Quotes
Keine relevanten Zitate gefunden.