本研究では、Motion Masked Diffusion Model (MMDM)を提案している。MMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
具体的には、以下の2つの特徴がある:
実験結果から、提案手法MMDMは、HumanML3Dデータセットとキットモーションデータセットにおいて、既存手法と比べて動作の質と多様性のバランスが良いことが示された。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen