核心概念
本論文では、2次元擬似姿勢のみを使用し、3次元の真値姿勢データを必要としない自己教師学習アプローチ「SelfPose3d」を提案する。SelfPose3dは、3次元姿勢の潜在表現を学習し、それを多視点の2次元関節位置と2次元ヒートマップに変換することで、幾何学的に整合性のある3次元姿勢を推定する。また、不正確な擬似ラベルに対処するための適応的な監督注意メカニズムも提案する。
要約
本論文では、多人数・多視点3次元姿勢推定のための新しい自己教師学習アプローチ「SelfPose3d」を提案している。
3次元姿勢の潜在表現を学習し、それを多視点の2次元関節位置と2次元ヒートマップに変換することで、幾何学的に整合性のある3次元姿勢を推定する。
3次元根位置の自己教師学習を行い、合成的に生成した3次元根位置と対応する多視点ルートヒートマップを使用して、3次元根位置を推定する。
不正確な擬似ラベルに対処するため、適応的な監督注意メカニズムを提案する。ソフト注意を用いた2次元ヒートマップ損失と、ハード注意を用いた2次元関節位置損失を組み合わせて使用する。
3つの公開ベンチマークデータセット(Panoptic、Shelf、Campus)で評価を行い、完全教師あり手法と同等の性能を達成することを示す。
統計
多視点入力画像から生成した2次元関節位置の平均絶対誤差は24.5 mm
多視点入力画像から生成した2次元関節位置の平均平方誤差は24.5 mm