核心概念
本文提出了MotionScript,一種從3D人體動作序列自動生成詳細文字描述的算法和表示方法。MotionScript相比於現有的自然語言方法,能夠提供更加詳細和準確的人體動作描述。
摘要
本文提出了MotionScript,一種從3D人體動作序列自動生成詳細文字描述的算法和表示方法。MotionScript與現有的自然語言表示方法不同,它提供了更加詳細的自然語言描述,而不僅僅是簡單的動作標籤或概括性的標題。
MotionScript的工作流程如下:
- 首先從3D關節坐標中提取姿態編碼(posecode),量化描述靜態姿態的空間和角度關係。
- 然後分析姿態編碼隨時間的變化,檢測動作段並提取動作編碼(motioncode),描述動作的時間、空間和速度屬性。
- 接下來,選擇最具代表性的動作編碼,並將其聚合成簡潔連貫的自然語言描述。
- 最後,將動作編碼元素填充到預定義的句子模板中,生成最終的文字描述。
MotionScript的優勢在於,它能夠自動生成比現有方法更加詳細和準確的人體動作描述,不需要依賴人工標註的訓練數據。這為基於文本的動作生成、虛擬人物模擬、手語生成等應用提供了新的可能性。
統計資料
人體動作的3D關節坐標是從SMPL-H模型獲得的,並進行了歸一化處理。
姿態編碼(posecode)包括角度、距離、相對位置、方向和接地等屬性。
動作編碼(motioncode)描述了動作的時間、空間和速度特徵,包括角度變化、距離變化、相對位置變化、位移和旋轉等。