Einheitliche und ausdrucksstarke Erzeugung von Gesten mit Sprachsteuerung durch expressive maskierte Audio-Gesten-Modellierung
Ein Rahmenwerk zur Erzeugung ganzheitlicher menschlicher Gesten aus Audio und teilweise oder vollständig maskierten Gesten, die Gesichtsausdrücke, lokale Körperdynamik, Handbewegungen und globale Übersetzungen umfassen.