Emotionale Sprachgesteuerte 3D-Körperanimation durch entkoppelte Latente Diffusion
Bestehende Methoden zur Synthese von 3D-Menschengesten aus Sprache haben vielversprechende Ergebnisse gezeigt, modellieren jedoch nicht explizit den Einfluss von Emotionen auf die generierten Gesten. AMUSE ist ein emotionale Sprachgesteuerte Körperanimationsmodell, das auf latenter Diffusion basiert und es ermöglicht, die ausgedrückte Emotion zu kontrollieren.