Centrala begrepp
提案手法のMMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
Sammanfattning
本研究では、Motion Masked Diffusion Model (MMDM)を提案している。MMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
具体的には、以下の2つの特徴がある:
- 時間フレームマスクと身体部位マスクの2つのマスク手法を導入することで、動作データの時間的特性と空間的構造を効果的に学習できるようにしている。
- マスクされた部分を予測させることで、動作の時空間的な関係性を学習し、生成された動作の質と多様性のバランスを取ることができる。
実験結果から、提案手法MMDMは、HumanML3Dデータセットとキットモーションデータセットにおいて、既存手法と比べて動作の質と多様性のバランスが良いことが示された。
Statistik
人間の動作を生成する際、テキストの説明に合致し、かつ自然で多様な動作を生成することが重要である。
Citat
"提案手法MMDMは、動作の時空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。"