Centrala begrepp
언어 모델의 지식을 활용하여 동작 시퀀스를 해석하고 편집할 수 있는 제어 가능한 동작 생성 모델
Sammanfattning
이 논문은 언어 기반 동작 생성 및 편집을 위한 CoMo 모델을 제안합니다. CoMo는 동작을 의미 있는 자세 코드로 분해하여 표현합니다. 이를 통해 언어 모델이 동작을 이해하고 편집할 수 있습니다.
주요 내용은 다음과 같습니다:
동작을 의미 있는 자세 코드로 분해하여 표현하는 Motion Encoder-Decoder 모듈
텍스트 입력과 언어 모델 생성 키워드를 활용하여 자세 코드를 생성하는 Motion Generator 모듈
언어 모델을 활용하여 자세 코드를 편집하는 Motion Editor 모듈
실험 결과, CoMo는 기존 방법 대비 동작 생성 성능이 경쟁력 있으며, 사용자 평가에서도 동작 편집 능력이 우수한 것으로 나타났습니다. 이를 통해 CoMo가 언어 기반 동작 생성 및 편집에 효과적임을 보여줍니다.
Statistik
동작 생성 성능 지표인 R-Precision, FID, MM-DIST, Diversity, MModality 값이 제시되었습니다.
동작 편집 실험에서 사용자 선호도 비율이 제시되었습니다.