Core Concepts
UPose3Dは、2Dキーポイント推定器と姿勢コンパイラモジュールを組み合わせることで、時間的・クロスビュー情報を活用し、3D人体姿勢を高精度に推定する手法である。また、不確実性モデリングを導入することで、外れ値や雑音に対するロバスト性を向上させている。
Abstract
UPose3Dは、多視点3D人体姿勢推定の課題に取り組む新しい手法である。
2Dキーポイント推定器と姿勢コンパイラモジュールを組み合わせることで、時間的・クロスビュー情報を活用し、3D人体姿勢を推定する。
2Dキーポイント推定器では、正規化流モデルを用いて不確実性を推定し、ロバスト性を向上させる。
姿勢コンパイラモジュールでは、ポイントクラウドエンコーダとスペースタイムエンコーダを用いて、クロスビューと時間情報を効果的に統合する。
3D注釈付きデータを必要とせず、大規模モーションキャプチャデータから合成した多視点データを用いて学習する。
実験の結果、提案手法はin-distributionおよびout-of-distribution設定の両方で優れた性能を示す。
Stats
2Dキーポイントの予測誤差は、単一フレームで26.9mm、27フレームで26.4mmである。
Procrustes整列後の平均誤差は、単一フレームで24.1mm、27フレームで23.4mmである。
正規化平均誤差は、単一フレームで26.2mm、27フレームで25.6mmである。
Quotes
"UPose3Dは、2Dキーポイント推定器と姿勢コンパイラモジュールを組み合わせることで、時間的・クロスビュー情報を活用し、3D人体姿勢を高精度に推定する手法である。"
"提案手法は、3D注釈付きデータを必要とせず、大規模モーションキャプチャデータから合成した多視点データを用いて学習する。"
"実験の結果、提案手法はin-distributionおよびout-of-distribution設定の両方で優れた性能を示す。"