Die Studie präsentiert einen neuartigen Ansatz namens STRIDE (Single-video based TempoRally contInuous occlusion Robust 3D Pose Estimation) zur zeitlich konsistenten 3D-Posenestimatation unter Verdeckungen.
Der Kernaspekt ist ein parametrischer Bewegungsprior, der vorab auf 3D-Posendaten trainiert wird, um natürliche menschliche Bewegungsdynamiken zu lernen. Dieser Prior wird dann bei Testzeit auf jedes neue Video feinabgestimmt, um die spezifischen Verdeckungsmuster zu berücksichtigen.
STRIDE kann mit beliebigen 3D-Posenestimatoren kombiniert werden, um deren Ausgaben zu verfeinern und zeitlich zu glätten. Im Vergleich zu bestehenden Methoden zeigt STRIDE deutlich verbesserte Leistung bei starken und lang anhaltenden Verdeckungen, ohne dabei auf zusätzliche Trainingsdaten angewiesen zu sein.
Die Evaluierung auf herausfordernden Datensätzen wie Occluded Human3.6M und OCMotion belegt die Überlegenheit von STRIDE gegenüber dem Stand der Technik. Insbesondere bei Szenarien mit bis zu 100% Verdeckung über mehrere aufeinanderfolgende Frames erzielt STRIDE deutlich genauere und zeitlich konsistentere Posen.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Rohit Lal,Sa... : arxiv.org 03-15-2024
https://arxiv.org/pdf/2312.16221.pdfDaha Derin Sorular