核心概念
RELI11Dは、LiDAR、IMU、RGB、イベントカメラの4つのモダリティを含む高品質な人物モーションデータセットであり、複雑で高速な動作の理解に課題をもたらす。提案手法LEIRは、これらのモダリティを効果的に融合し、人物姿勢推定の性能を向上させる。
要約
本論文は、人物姿勢推定(HPE)の課題に取り組むため、高品質な多様なモーションデータセットRELI11Dを提案している。RELI11Dは、LiDAR、IMU、RGB、イベントカメラの4つのモダリティを含み、10人の被験者が5つのスポーツを7つのシーンで行う動作を記録している。総時間は3.32時間に及ぶ。
データセットの評価では、既存のHPE手法が複雑で高速な動作に対応できないことが示された。そこで提案手法LEIRは、LiDARの幾何情報、イベントの動きの情報、RGBの外観情報を効果的に融合することで、優れた姿勢推定性能を実現している。
LEIRは、LiDARのみ、LiDAR+RGB、LiDAR+イベント、LiDAR+RGB+イベントの各入力モダリティで評価され、複数モダリティを組み合わせることで最良の結果が得られることが示された。また、LEIRは既存手法と比べても優れた性能を発揮することが確認された。
統計
LiDARの点群データは3.32時間分、20FPSで記録されている
RGBビデオは199.26分、60FPSで記録されている
イベントカメラのデータは3.32時間分記録されている
IMUデータは60FPSで記録されている
引用
"Comprehensive capturing of human motions requires both accurate captures of complex poses and precise localization of the human within scenes."
"To obtain the holistic understanding of human motions, using multiple types of sensors is important."
"RELI11D is the first HPE dataset consisting of the RGB, IMU, LiDAR, and Event modalities."