Wir präsentieren das Large Motion Model (LMM), das erste generalistische multimodale Bewegungserzeugungsmodell, das mehrere Bewegungserzeugungsaufgaben gleichzeitig durchführen und über neun weit verbreitete Benchmarks wettbewerbsfähige Leistung erzielen kann.
MotionGPT ist ein neuartiger und einheitlicher Rahmen zur Erzeugung menschlicher Bewegungen, der sowohl Textbeschreibungen als auch einzelne Schlüsselpose-Eingaben als Steuersignale nutzen kann.