本研究では、Motion Masked Diffusion Model (MMDM)を提案している。MMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
具体的には、以下の2つの特徴がある:
実験結果から、提案手法MMDMは、HumanML3Dデータセットとキットモーションデータセットにおいて、既存手法と比べて動作の質と多様性のバランスが良いことが示された。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Xingyu Chen às arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19686.pdfPerguntas Mais Profundas