Core Concepts
WonderJourney ist ein modulares Framework zur Erzeugung einer langen Sequenz von diversen, aber kohärent verbundenen 3D-Szenen, ausgehend von einem beliebigen Startpunkt.
Abstract
WonderJourney ist ein neuer Ansatz zur Erzeugung von "Wonderjourneys" - einer Sequenz von diversen, aber kohärent verbundenen 3D-Szenen. Im Gegensatz zu früheren Arbeiten, die sich auf die Generierung einzelner Szenentypen konzentrierten, zielt WonderJourney darauf ab, von einem beliebigen Startpunkt (durch eine Textbeschreibung oder ein Bild) ausgehend, eine Reise durch eine lange Sequenz verschiedener 3D-Szenen zu generieren.
WonderJourney besteht aus drei Hauptmodulen:
- Szenenbeschreibungsgenerierung: Ein Großsprachmodell (LLM) erzeugt eine Sequenz von Textbeschreibungen der Szenen.
- Visuelle Szenengenerierung: Ein textgesteuerter visueller Generierungsmodul erstellt eine Sequenz von 3D-Punktwolken, die die zusammenhängenden Szenen darstellen.
- Visuelle Validierung: Ein Sprach-Bild-Modell (VLM) überprüft die generierten Szenen auf unerwünschte Effekte und startet bei Bedarf einen Neustart des Generierungsprozesses.
Die Autoren zeigen überzeugende, vielfältige visuelle Ergebnisse über verschiedene Szenentypen und Stile hinweg und führen Nutzerstudien durch, die zeigen, dass WonderJourney interessantere und abwechslungsreichere Reisen erzeugt als bestehende Ansätze.
Stats
Die generierten 3D-Szenen ermöglichen das Rendern eines Fluges durch eine lange Sequenz verschiedener Szenen, um das visuelle Erlebnis einer Reise in einem imaginären "Wunderland" zu simulieren.
WonderJourney zielt darauf ab, eine potentiell endlose Sequenz von diversen, aber kohärent verbundenen 3D-Szenen zu erzeugen.
Die Herausforderungen umfassen das Generieren vielfältiger, aber plausibler Szenenelemente, die einen Pfad durch geometrisch verbundene 3D-Szenen unterstützen.
Quotes
"Keine, keine! Die Abenteuer zuerst, Erklärungen brauchen so eine schreckliche Zeit." - Alice's Adventures in Wonderland