Core Concepts
HumMUSS는 상태 공간 모델을 활용하여 효율적이고 실시간으로 동작하는 인체 동작 이해 모델이다. 기존 트랜스포머 기반 모델에 비해 빠른 학습 및 추론 속도와 다양한 프레임 레이트에 대한 일반화 능력을 보인다.
Abstract
이 논문은 인체 동작 이해를 위한 새로운 모델 HumMUSS를 제안한다. HumMUSS는 상태 공간 모델(State Space Model)을 기반으로 하며, 기존 트랜스포머 기반 모델의 한계를 극복한다.
HumMUSS의 주요 특징은 다음과 같다:
상태 공간 모델을 활용하여 실시간 순차 추론에 매우 효율적이며, 트랜스포머 기반 모델에 비해 메모리 사용량과 추론 속도가 크게 향상된다.
연속 시간 모델 특성으로 인해 다양한 프레임 레이트에 대한 일반화 능력이 뛰어나다.
학습 속도가 빨라 긴 시퀀스의 동작 데이터를 효과적으로 학습할 수 있다.
3D 자세 추정, 메시 복원, 동작 인식 등 다양한 동작 이해 태스크에서 경쟁력 있는 성능을 보인다.
HumMUSS는 트랜스포머 기반 모델의 한계를 극복하고 실시간 응용 분야에 적합한 새로운 동작 이해 모델을 제시한다.
Stats
3D 자세 추정 시 HumMUSS의 MPJPE(mm)는 21.0으로 기존 최고 성능 대비 향상되었다.
메시 복원 시 HumMUSS의 MPVE(mm)는 80.5로 기존 최고 성능과 유사한 수준이다.
동작 인식 시 HumMUSS의 정확도는 97.4%로 최신 방법 중 두 번째로 높다.
Quotes
"HumMUSS not only matches the performance of transformer-based models in various motion understanding tasks but also brings added benefits like adaptability to different video frame rates and enhanced training speed when working with longer sequences of keypoints."
"HumMUSS operates as a stateful recurrent model during sequential inference, requiring only the current frame and the state that summarizes the past frames. This substantially boosts the inference speed and efficiency of HumMUSS relative to MotionBERT."