Core Concepts
WANDRは、初期姿勢と3D目標位置を入力として受け取り、人間らしい自然な動作を生成し、手首を目標位置に到達させる。
Abstract
本研究では、WANDRと呼ばれる新しいデータ駆動型の手法を提案している。WANDRは、初期姿勢と3D目標位置を入力として受け取り、人間らしい自然な動作を生成し、手首を目標位置に到達させる。
WANDRの主な特徴は以下の通りである:
意図特徴: WANDRは、姿勢、位置、方向の意図特徴を導入することで、目標指向型の自然な動作を生成できる。これらの特徴は、訓練時にはラベル付きデータから、ラベルのない大規模データからも抽出できる。
自己回帰的な動作生成: WANDRは、フレーム単位で自己回帰的に動作を生成する条件付きVariational AutoEncoderを使用する。これにより、長期的な動作を生成しつつ、局所的な動作の自然さも保つことができる。
汎化性: WANDRは、訓練データに含まれていない目標位置に対しても、自然な動作を生成できる。これは、意図特徴が目標位置に応じて動的に更新されるためである。
実験の結果、WANDRは、既存手法と比較して、目標到達率が高く、自然な動作を生成できることが示された。また、目標位置の高さや距離を変更することで、速度の異なる動作を生成できることも確認された。
Stats
手首が目標位置から10cm以内に到達した割合は32%である。
足のスケーティングの割合は16%である。
手首が目標位置に最も近づいた距離は24.8cmである。
Quotes
"目標は私たちの動作を駆動する。たとえ最も単純な目標でも、複雑な動作を引き起こすことができる。"
"動作の階層、すなわち全体的な目標から瞬間的な個別の行動までを生成することは、コンピュータビジョン、グラフィックス、ロボティクスにおける長年の課題である。"