提案するBAMMモデルは、テキストの説明に正確に合わせた自然な人間の動きを生成し、動作の長さを自動的に予測することができる。また、様々な編集タスクにも対応できる柔軟性を持っている。
複数の部位モーションを生成し、それらを協調させることで、テキストの記述に合致し、調和の取れたモーションを生成する。