本研究は、物体の姿勢アノテーションを必要とせずに、カテゴリレベルの物体姿勢推定器を学習する新しい手法を提案する。拡散モデルを利用して生成された複数の物体ビューから、物体姿勢の特徴を学習することで、効率的に姿勢推定器を構築できる。
PACE は、複雑な環境における物体姿勢推定と追跡のための大規模なベンチマークデータセットである。データセットには、多様な物体、複雑なシーン、様々な遮蔽状況が含まれており、現実世界の姿勢推定課題に関連する重要な課題に取り組むことができる。
拡散モデルの中間特徴を効果的に集約することで、物体姿勢推定の汎化性能を大幅に向上させることができる。