Durch die Verbesserung der beiden Eingaben - Rauschen und Textprompt - kann die diffusionsbasierte Text-zu-Video-Generierung deutlich verbessert werden.