toplogo
Log på

テキストから自然で調和の取れた3Dヒューマンモーションを生成する


Kernekoncepter
複数の部位モーションを生成し、それらを協調させることで、テキストの記述に合致し、調和の取れたモーションを生成する。
Resumé

本研究では、テキストからヒューマンモーションを生成する課題に取り組んでいる。従来のアプローチでは、全身のモーションを一つのジェネレータで生成するため、部位間の協調が不足していたり、部位概念の理解が難しいという課題があった。

本手法では、以下の2段階のアプローチを提案している:

  1. 全身モーションを複数の部位モーションに分割し、それぞれを個別に量子化する。これにより、部位概念の理解を促す。
  2. 部位ごとにジェネレータを用意し、それらの間で協調を取ることで、部位間の調和の取れたモーションを生成する。

具体的には、6つの小さなジェネレータを用意し、それぞれが右腕、左腕、右脚、左脚、体幹、骨盤の部位モーションを生成する。これらのジェネレータ間で情報交換を行うことで、部位間の協調を実現している。

実験の結果、提案手法は既存手法と比べて、テキストとモーションの整合性や、生成モーションの自然さ、多様性などの指標で優れた性能を示した。また、計算コストも低く、効率的な手法であることが確認された。

edit_icon

Tilpas resumé

edit_icon

Genskriv med AI

edit_icon

Generer citater

translate_icon

Oversæt kilde

visual_icon

Generer mindmap

visit_icon

Besøg kilde

Statistik
生成モーションとテキストの整合性を示すTop-1精度は0.515±0.003で、実際のモーションデータ(0.511±0.003)を上回っている。 生成モーションと実際のモーションの分布の差を示すFIDは2.927±0.008で、既存手法より優れている。 テキストとモーションの意味的な類似度を示すMM-Distは1.382±0.060で、既存手法より良好な結果となっている。
Citater
なし

Vigtigste indsigter udtrukket fra

by Qiran Zou,Sh... kl. arxiv.org 03-28-2024

https://arxiv.org/pdf/2403.18512.pdf
ParCo

Dybere Forespørgsler

テキストからモーションを生成する際、どのようにして部位間の協調を学習することができるか?

提案手法では、部位間の協調を学習するために複数の小さなジェネレータを使用しています。まず、全身のモーションを複数の部位モーションに分割し、それぞれの部位モーションをVQ-VAEを使用して独立して符号化します。次に、前段階で得られた部位モーションの符号化を使用して、異なる部位モーションの生成を担当する複数の小さなトランスフォーマーを使用します。これにより、各部位モーションジェネレータが「部位モーション」という概念を認識し、テキストからモーションを生成する際に協調できるようになります。さらに、部位間のコミュニケーションを促進するために、部位調整モジュールを導入しています。このモジュールにより、異なる部位モーションジェネレータ間でコミュニケーションが可能となり、全身のモーションを協調して生成することができます。

テキストからモーションを生成する際の評価指標について、どのような新しい指標が考えられるか?

テキストからモーションを生成する際の評価指標として、以下のような新しい指標が考えられます: Semantic Alignment Score: テキストと生成されたモーションの意味的な整合性を評価する指標。テキストの記述とモーションの内容がどれだけ適合しているかを定量化することができます。 Hierarchical Part Coordination Metric: 部位間の階層的な関係性を評価する指標。提案手法のように部位ごとのジェネレータを使用している場合、各部位の生成されたモーションが階層的な関係性を適切に捉えているかを評価することが重要です。 Diversity of Motion Sequences: 生成されたモーションシーケンスの多様性を評価する指標。生成されたモーションが単調でなく、多様な動きを含んでいるかどうかを評価することができます。 Realism Score: 生成されたモーションのリアリティを評価する指標。モーションが実世界で観察される動きにどれだけ近いかを定量化することができます。 これらの新しい評価指標を導入することで、テキストからモーションを生成する手法の性能をより包括的に評価することが可能となります。
0
star