本研究では、Motion Masked Diffusion Model (MMDM)を提案している。MMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
具体的には、以下の2つの特徴がある:
実験結果から、提案手法MMDMは、HumanML3Dデータセットとキットモーションデータセットにおいて、既存手法と比べて動作の質と多様性のバランスが良いことが示された。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Xingyu Chen : arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19686.pdfDaha Derin Sorular