Core Concepts
提案するJCRA (Joint Coordinate Regression and Association) アルゴリズムは、ポストプロセスを必要とせずに、入力画像から直接的に人物の姿勢関節を推定する、新しい一段階エンドツーエンドのアプローチです。
Abstract
本論文では、ポストプロセスを必要とせずに人物の姿勢関節を直接推定する新しい一段階エンドツーエンドの多人数姿勢推定アルゴリズムであるJCRA (Joint Coordinate Regression and Association)を提案しています。
JCRAのアーキテクチャは以下のようになっています:
ResNetをバックボーンとして特徴抽出を行い、
キーポイントエンコーダーで特徴を精緻化し、
キーポイントデコーダーで並列に300個の全身キーポイントを推定します。
関節座標の回帰と関連付けを同時に行うことで、ポストプロセスを不要とします。
JCRAは、COCO ベンチマークにおいて、最新のエンドツーエンド手法を上回る69.2 mAPを達成し、さらに推論速度も大幅に向上させています。また、CrowdPoseデータセットでも最高水準の性能を示しています。
JCRAの主な特徴は以下の通りです:
一段階エンドツーエンドアーキテクチャにより、高速かつ正確な姿勢推定を実現
エンコーダーとデコーダーの対称的な設計により、高精度な姿勢推定を実現
関節座標の回帰と関連付けを同時に行うことで、ポストプロセスを不要とする
Stats
提案手法JCRA は、COCO val2017データセットにおいて69.2 mAPを達成し、最新のエンドツーエンド手法を上回る性能を示しています。
JCRA は、COCO test-devデータセットにおいて67.6 mAPを達成し、最新の手法と同等の性能を示しています。
JCRA は、CrowdPoseテストデータセットにおいて71.9 mAPを達成し、最新の二段階エンドツーエンド手法を上回る性能を示しています。
Quotes
"提案するJCRA (Joint Coordinate Regression and Association) アルゴリズムは、ポストプロセスを必要とせずに、入力画像から直接的に人物の姿勢関節を推定する、新しい一段階エンドツーエンドのアプローチです。"
"JCRAは、COCO ベンチマークにおいて、最新のエンドツーエンド手法を上回る69.2 mAPを達成し、さらに推論速度も大幅に向上させています。"
"JCRAの主な特徴は、一段階エンドツーエンドアーキテクチャ、エンコーダーとデコーダーの対称的な設計、関節座標の回帰と関連付けを同時に行うことで、ポストプロセスを不要とすることです。"