LAVIMO ist ein neuartiges Framework für drei-Modalitäten-Lernen, das eine gemeinsame Einbettung für Text, Video und Bewegung schafft.