本論文は、単眼ビデオから3D人間動作を再構築する新しい手法「Video-to-Motion Generator (VTM)」を提案している。VTMは、3D人間動作データと2Dビデオ/キーポイントデータの潜在特徴空間を整列させることで、動作の事前知識を活用する。
具体的には以下の手順で動作を再構築する:
この手法により、従来手法と比べて高精度な3D動作再構築が可能となり、さらに、未知の視点角度や野生の動画にも適用できることを示している。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Shuaiying Ho... ที่ arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09499.pdfสอบถามเพิ่มเติม