이 논문은 텍스트 기반 인간 동작 생성을 위한 새로운 모델인 BAMM(Bidirectional Autoregressive Motion Model)을 소개한다. BAMM은 두 가지 핵심 구성 요소로 이루어져 있다:
BAMM의 이러한 특징을 통해 고품질 동작 생성, 향상된 사용성, 내장된 동작 편집 기능을 동시에 달성할 수 있다. 실험 결과, BAMM은 HumanML3D와 KIT-ML 데이터셋에서 정성적, 정량적 측면 모두에서 현재 최신 기술을 능가하는 성능을 보여준다. 또한 BAMM은 동작 내삽, 외삽, 접두사 예측, 접미사 완성 등 다양한 동작 편집 작업을 제로 샷 방식으로 지원한다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Ekkasit Piny... في arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19435.pdfاستفسارات أعمق