Core Concepts
Ein effizientes und robustes Modell zur Vorhersage menschlicher 3D-Bewegungen in kurz- und langfristiger Perspektive, das auch bei starker Verdeckung der Beobachtungen gute Ergebnisse liefert.
Abstract
Das vorgestellte 2-Kanal-Transformer-Modell (2CH-TR) ermöglicht eine effiziente Ausnutzung der räumlich-zeitlichen Informationen in einer kurzen Beobachtungssequenz (400 ms) und erzielt dabei eine wettbewerbsfähige Genauigkeit gegenüber dem aktuellen Stand der Technik. 2CH-TR zeichnet sich durch eine effiziente Transformerleistung aus, ist leichter und schneller als seine Konkurrenten. Darüber hinaus wird das Modell unter Bedingungen getestet, bei denen die menschliche Bewegung stark verdeckt ist, und zeigt seine Robustheit bei der Rekonstruktion und Vorhersage von 3D-Menschenbewegungen in einer stark verrauschten Umgebung. Die Experimente zeigen, dass das vorgeschlagene 2CH-TR das ST-Transformer-Modell, das ebenfalls auf dem Transformer-Prinzip basiert, in Bezug auf Rekonstruktion und Vorhersage unter den gleichen Eingabebedingungen übertrifft. Unser Modell reduziert den mittleren quadratischen Fehler von ST-Transformer um 8,89% bei der Kurzfristvorhersage und um 2,57% bei der Langfristvorhersage im Human3.6M-Datensatz mit einem 400-ms-Eingabeprefix.
Stats
Die Bewegungsvorhersage unseres Modells reduziert den mittleren quadratischen Fehler von ST-Transformer um 8,89% bei der Kurzfristvorhersage und um 2,57% bei der Langfristvorhersage im Human3.6M-Datensatz mit einem 400-ms-Eingabeprefix.
Quotes
Keine relevanten Zitate gefunden.