本研究は、3次元人体姿勢推定(3D HPE)における2次元から3次元への変換(2D-to-3D lifting)の課題に取り組んでいる。2D-to-3D liftingは、単一の2D姿勢から複数の妥当な3D姿勢を生成する必要があるため、ill-posed問題として知られている。
提案手法PRPoseは、単一仮説モデル(SH-HPE)の確率モデリング過程を再構築することで、効率的かつ高精度な多仮説3D HPEを実現する。具体的には、SH-HPEモデルの隠れ確率分布を弱教師あり学習により推定し、適応的なノイズサンプリング戦略を用いて2D入力に適用することで、多様な3D姿勢仮説を生成する。
実験結果では、Human3.6MおよびMPI-INF-3DHP benchmarkにおいて、状態の最前線手法と同等の精度を達成しつつ、推定速度を2桁以上向上させることができた。また、適応的ノイズ生成の有効性を定量的・定性的に検証し、提案手法の合理性を示した。
本研究は、単一仮説モデルの確率モデリング能力を活用し、効率的な多仮説生成を実現する新しい枠組みを提案した点で意義がある。今後は、人体構造や2D姿勢に基づいた適応的ノイズ生成手法の更なる探索が期待される。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Xianzhou Zen... ที่ arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.02114.pdfสอบถามเพิ่มเติม