Keskeiset käsitteet
細かいテキスト記述を使用して、新しい言語-動作データセットFineHumanML3Dを構築し、FineMotionDiffuseモデルを提案。複合的な動きに対処する強力な汎化能力を示す。
Tiivistelmä
この記事は、自然言語指示と人体運動の相互作用を探るために、細かいテキスト記述から動作シーケンスを生成するタスクに焦点を当てています。従来の粗大な運動記述に制限されていた多くの既存の研究とは異なり、関連する身体部位の移動を指定する細かい記述に焦点を当てています。本論文では、GPT-3.5-turboに繊細なプロンプトを与えることで、FineHumanML3Dという大規模な言語-運動データセットを構築しました。さらに、FineMotionDiffuseモデルを提案し、その実験結果が定量評価で良好な結果を示しています。
目次
- 導入
- 関連研究
- 細かい言語-運動データセット構築
- GPT-turbo-3.5による拡張プロンプト設計と評価
- モデル提案
- FineMotionDiffuseモデルアーキテクチャー解説
- 実験結果
- FineMotionDiffuseと他ベースラインモデル比較結果
Tilastot
本論文ではGPT-3.5-turboが使用されております。
FineHumanML3Dは85,646件の細かいテキスト記述が含まれる。
FineMotionDiffuseはFineHumanML3Dで訓練された結果が良好であることが示されています。
Lainaukset
"Models trained with coarse texts may not be able to learn mappings from fine-grained motion-related words to motion primitives."
"We propose FineMotionDiffuse to make best of both fine and coarse-grained descriptions."