核心概念
本文提出了一種名為 Morph 的動作生成框架,其核心是無需真實動作數據,即可通過物理模擬和強化學習,提升生成動作的物理逼真度。
摘要
Morph 框架概述
本論文介紹了一種名為 Morph 的動作生成框架,旨在解決現有動作生成方法缺乏物理約束,導致生成動作不自然的問題。Morph 框架的最大特點是無需依賴真實動作數據,即可提升生成動作的物理逼真度。
Morph 框架的兩個核心模塊
Morph 框架由兩個主要模塊組成:動作生成器(Motion Generator, MG)和動作物理細化模塊(Motion Physics Refinement, MPR)。
動作生成器(MG)
動作生成器可以是任何現有的預訓練動作生成模型,例如基於擴散的模型、自回歸模型或生成掩碼模型等。
動作物理細化模塊(MPR)
動作物理細化模塊負責將動作生成器生成的動作序列,通過物理模擬的方式進行優化,使其符合物理規律,從而提升動作的逼真度。
Morph 框架的兩階段訓練過程
Morph 框架採用兩階段訓練過程:
第一階段:訓練動作物理細化模塊(MPR)
- 利用預訓練的動作生成器生成大量帶噪聲的動作數據。
- 使用這些帶噪聲的動作數據訓練動作物理細化模塊,使其能夠將輸入動作映射到符合物理規律的動作空間。
第二階段:微調動作生成器(MG)
- 利用訓練好的動作物理細化模塊,生成大量符合物理規律的高質量動作數據。
- 使用這些高質量動作數據微調動作生成器,進一步提升其生成逼真動作的能力。
Morph 框架的優勢
- 無需真實動作數據:Morph 框架不依賴於真實動作數據,僅使用生成數據即可訓練物理細化模塊,降低了數據收集成本。
- 模型无关性:Morph 框架可以與各種動作生成模型結合使用,具有良好的適應性。
- 高效性:Morph 框架僅需一步物理細化,即可顯著提升生成動作的物理逼真度。
實驗結果
論文在 HumanML3D 和 AIST++ 兩個數據集上,對 Morph 框架進行了評估。實驗結果表明,Morph 框架在多個動作生成任務和數據集上,都能夠顯著提升生成動作的物理逼真度,同時保持了良好的生成質量。
統計資料
Morph 框架將動作數據量增加到原來的三倍。
在動作物理細化模塊訓練階段,使用 Adam 優化器,批次大小為 64,學習率為 4 × 10^-5。
在動作生成器微調階段,學習率調整為 1 × 10^-5。
超參數設置:wθ, wq, wv 和 ww 分別為 0.5, 0.3, 0.1 和 0.1;αθ, αq, αv 和 αw 分別為 100, 10, 0.1 和 0.1;γ 為 0.1;動作選擇閾值 τ 為 0.5。
引述
"However, most existing motion generation approaches overlook a fundamental aspect of human motion: the laws of physics."
"A natural question arises: Is it possible to learn an efficient, model-agnostic physical optimizer without relying on real motion data?"
"This results in an economical, efficient, and model-agnostic physical optimizer."