Wir präsentieren TeFF, einen neuartigen Ansatz, um das Lernen von 3D-bewussten generativen Modellen aus Bildern in freier Wildbahn mit unbekannter Kamerapositionsverteilung zu ermöglichen. Durch die Schätzung der Kamerapositionen der Realbilder on-the-fly können wir zeigen, dass unser Verfahren in der Lage ist, die vollständige 3D-Geometrie aus Datensätzen mit herausfordernden Verteilungen wiederherzustellen.
EpiDiff ist ein lokalisiertes, interaktives Multiview-Diffusionsmodell, das epipolare Aufmerksamkeitsblöcke in einen gefrorenen Diffusionsmodell-Backbone einfügt, um die Konsistenz und Qualität der generierten Multiview-Bilder zu verbessern.