Unser Ansatz verwendet ein speziell entworfenes Rauschmodell, das die natürlichen Korrelationen zwischen Videoframes besser erfasst, um einen leistungsfähigen textgesteuerten Videosynthese-Diffusionsmodell zu entwickeln.
TrackDiffusion ermöglicht eine präzise Kontrolle über die Bewegungsabläufe in generierten Videosequenzen durch den Einsatz von Diffusionsmodellen.