Die Arbeit präsentiert AVSync15, ein hochwertiges Dataset, und AVSyncD, ein Modell zur Audio-synchronisierten visuellen Animation.