Effiziente Verarbeitung von Videoinhalten durch Diffusionsmodelle mit korreliertem Rauschen
Unser Ansatz verwendet ein speziell entworfenes Rauschmodell, das die natürlichen Korrelationen zwischen Videoframes besser erfasst, um einen leistungsfähigen textgesteuerten Videosynthese-Diffusionsmodell zu entwickeln.