本研究では、Motion Masked Diffusion Model (MMDM)を提案している。MMDMは、テキストに基づいて人間の動作を生成する際に、動作の時間的・空間的な関係性を学習することで、生成された動作の質と多様性のバランスを取ることができる。
具体的には、以下の2つの特徴がある:
実験結果から、提案手法MMDMは、HumanML3Dデータセットとキットモーションデータセットにおいて、既存手法と比べて動作の質と多様性のバランスが良いことが示された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Xingyu Chen lúc arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19686.pdfYêu cầu sâu hơn