Khái niệm cốt lõi
本文提出了一種新的人體動作生成模型 - 運動遮罩擴散模型(MMDM),通過在擴散過程中引入遮罩機制,顯著提升了模型在理解和預測人體動作時間和空間語義關係的能力,從而生成更加一致和相關的動作序列。
Tóm tắt
本文提出了一種新的人體動作生成模型 - 運動遮罩擴散模型(MMDM)。MMDM在擴散過程中引入遮罩機制,以增強模型對人體動作時間和空間語義關係的理解能力。
具體來說:
- 時間遮罩:MMDM在時間維度上對動作序列進行隨機遮罩,迫使模型從不完整的表示中推斷出完整的動作序列,從而學習到更好的時間關係。
- 身體部位遮罩:MMDM在身體部位維度上對動作序列進行遮罩,使模型能夠更好地學習不同身體部位之間的空間關係。
- 實驗結果表明,MMDM不僅顯著提升了生成動作序列與文本描述的一致性,同時也保持了整體生成質量和多樣性。
Thống kê
在HumanML3D數據集上,MMDM的FID分數為0.276,Top-3 R Precision為0.742,多樣性指標為3.355。
在KIT-ML數據集上,MMDM的FID分數為0.278,Top-3 R Precision為0.772,多樣性指標為2.925。
Trích dẫn
"本文提出了一種新的人體動作生成模型 - 運動遮罩擴散模型(MMDM),通過在擴散過程中引入遮罩機制,顯著提升了模型在理解和預測人體動作時間和空間語義關係的能力,從而生成更加一致和相關的動作序列。"
"MMDM在時間維度和身體部位維度上對動作序列進行遮罩,使模型能夠更好地學習動作序列中的時間關係和空間關係。"