Die Studie präsentiert einen neuartigen Ansatz namens STRIDE (Single-video based TempoRally contInuous occlusion Robust 3D Pose Estimation) zur zeitlich konsistenten 3D-Posenestimatation unter Verdeckungen.
Der Kernaspekt ist ein parametrischer Bewegungsprior, der vorab auf 3D-Posendaten trainiert wird, um natürliche menschliche Bewegungsdynamiken zu lernen. Dieser Prior wird dann bei Testzeit auf jedes neue Video feinabgestimmt, um die spezifischen Verdeckungsmuster zu berücksichtigen.
STRIDE kann mit beliebigen 3D-Posenestimatoren kombiniert werden, um deren Ausgaben zu verfeinern und zeitlich zu glätten. Im Vergleich zu bestehenden Methoden zeigt STRIDE deutlich verbesserte Leistung bei starken und lang anhaltenden Verdeckungen, ohne dabei auf zusätzliche Trainingsdaten angewiesen zu sein.
Die Evaluierung auf herausfordernden Datensätzen wie Occluded Human3.6M und OCMotion belegt die Überlegenheit von STRIDE gegenüber dem Stand der Technik. Insbesondere bei Szenarien mit bis zu 100% Verdeckung über mehrere aufeinanderfolgende Frames erzielt STRIDE deutlich genauere und zeitlich konsistentere Posen.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問