Core Concepts
手の姿勢推定を利用し、最小限のデータで効率的にカタカリの手の動作を認識する手法を提案する。
Abstract
本研究は、インド古典舞踊カタカリの手の動作(ムードラ)を認識する手法を提案している。ムードラは舞踊の基本的な動作単位であり、その認識は舞踊の理解に不可欠である。
提案手法は以下の特徴を持つ:
手の姿勢推定技術を利用し、大量のトレーニングデータを必要としない。
手の座標値を特徴量として使い、ユークリッド距離に基づいて最近傍のムードラを検索する。
正規化処理により、手の大きさ、角度、位置などの変化に頑健である。
手のみの画像でなく、全身画像や動画にも適用可能。
実験の結果、既存の深層学習ベースの手法と同等以上の精度(92%)を達成できることが示された。さらに、1クラスあたり1サンプルや5サンプルといった極端に少ないデータでも一定の性能を発揮できることが確認された。
本手法は、カタカリのみならず、他の舞踊形式やサイン言語の動作認識にも応用可能である。また、少ないデータで高い汎化性を持つため、新しい分野への適用が容易であり、文化遺産の保護や教育への活用が期待される。
Stats
手の姿勢推定により得られる21個の3次元座標値を特徴量として使用している。
1クラスあたり1サンプルの場合の精度は63%、5サンプルの場合は75%、10サンプルの場合は83%である。
80:20の訓練/テストデータ分割では92%の精度を達成した。
Quotes
"本研究は、文化遺産の保護や教育への活用が期待される、新しい分野への適用が容易な手法を提案している。"
"提案手法は、手の大きさ、角度、位置などの変化に頑健であり、手のみの画像でなく、全身画像や動画にも適用可能である。"