Core Concepts
本研究は、遮蔽に対してロバストな頭部姿勢推定のための新しい手法を提案する。特に、各姿勢角度に対する回帰と分類のコンポーネントを持つ、教師なしの潜在的な埋め込みクラスタリングを導入する。このモデルは、遮蔽された画像と非遮蔽画像の潜在的な特徴表現を最適化することで、精度の高い角度予測を実現する。
Abstract
本研究は、頭部姿勢推定(HPE)における遮蔽の問題に取り組むための新しい手法を提案する。従来の手法は、遮蔽に対して脆弱であり、実世界の環境では信頼できる性能を発揮できないという課題があった。
提案手法では、教師なしの潜在的な埋め込みクラスタリングと、各Euler角度に対する回帰と分類のコンポーネントを組み合わせることで、遮蔽された画像と非遮蔽画像の潜在的な特徴表現を最適化する。これにより、精度の高い角度予測を実現する。
提案手法の主な特徴は以下の通り:
遮蔽に対してロバストな頭部姿勢推定を実現
計算コストが低い
ベンチマークデータセットで最先端の性能を発揮
必要な教師データを大幅に削減
遮蔽された画像の学習データを拡張する柔軟性がある
提案手法は、BIWI、AFLW2000、Pandoraのベンチマークデータセットで評価され、遮蔽された画像に対して従来手法を大幅に上回る性能を示した。また、教師データの削減と遮蔽データの拡張性についても優れた特性を持つことが確認された。
Stats
遮蔽された画像に対する提案手法の平均角度誤差(MAE)は、AFLW2000で36%、BIWIで17%、Pandoraで11%改善された。
全体の平均角度誤差(MAE)は、AFLW2000で19.6%、Pandoraで11.1%、BIWIで7%改善された。