Core Concepts
提案するHiHネットワークは、シルエットと2Dポーズデータを統合し、階層的な歩容特徴の抽出と空間-時間的な処理を行うことで、制約のない環境下での高精度な歩容認識を実現する。
Abstract
本論文は、制約のない環境下での歩容認識の課題に取り組むため、階層的多様体ネットワーク(HiH)を提案している。HiHは、シルエットと2Dポーズデータを統合的に処理する2つのブランチから構成される。
メインブランチでは、階層的歩容分解器(HGD)モジュールを用いて、シルエットデータから全体的な歩容パターンを抽出する。HGDは深さ方向と幅方向の階層的な特徴抽出を行い、全身の動きから各部位の動きまでを表現する。
補助ブランチでは、ポーズデータを用いて、HGDの空間的および時間的な処理を強化する。具体的には、変形可能な空間強化(DSE)モジュールがポーズ情報に基づいて重要な領域に注目し、変形可能な時間整列(DTA)モジュールが学習した時間オフセットを用いて歩容の時間変化に適応する。
これらの階層的特徴抽出と空間-時間的な処理により、HiHは制約のない環境下でも高精度な歩容認識を実現している。実験では、Gait3DやGREWなどの野外データセットで最先端の性能を示し、OUMVLP、CASIA-Bなどの室内データセットでも優れた結果を得ている。
Stats
シルエットと2Dポーズの統合により、全身の動きから各部位の動きまでを表現できる。
HGDの階層的特徴抽出と、DSEおよびDTAによる空間-時間的な処理により、制約のない環境下でも高精度な歩容認識が可能となる。
Quotes
"提案するHiHネットワークは、シルエットと2Dポーズデータを統合し、階層的な歩容特徴の抽出と空間-時間的な処理を行うことで、制約のない環境下での高精度な歩容認識を実現する。"
"HGDは深さ方向と幅方向の階層的な特徴抽出を行い、全身の動きから各部位の動きまでを表現する。"
"DSEがポーズ情報に基づいて重要な領域に注目し、DTAが学習した時間オフセットを用いて歩容の時間変化に適応する。"