核心概念
본 연구는 입력 데이터에 따라 동적으로 관절 간 관계를 구축하고, 복잡한 인간 동작을 효과적으로 모델링하는 새로운 공간-시간 모듈을 제안한다. 이를 통해 기존 방법들을 능가하는 수화 인식 성능을 달성한다.
要約
본 연구는 수화 인식을 위한 새로운 방법론을 제안한다. 기존 방법들은 고정된 그래프 구조 또는 단일 학습 가능 그래프를 사용하여 관절 간 관계를 모델링하였지만, 이는 입력 데이터에 따라 동적으로 변화하는 관계를 충분히 반영하지 못했다. 또한 단순한 시간 컨볼루션을 사용하여 복잡한 인간 동작을 모델링하는 데 한계가 있었다.
이에 본 연구는 다음과 같은 두 가지 핵심 기여를 제안한다:
- 입력 데이터에 따라 동적으로 관절 간 관계를 구축하는 그래프 상관 모듈을 도입한다. 이를 통해 관절 간 중요한 연결을 효과적으로 포착할 수 있다.
- 다중 스케일 시간 컨볼루션 모듈을 제안하여, 다양한 시간 범위의 복잡한 인간 동작을 효과적으로 모델링할 수 있다.
이러한 공간-시간 모듈의 장점을 통해, 본 연구는 4개의 대규모 수화 인식 벤치마크에서 최신 성능을 달성했다. 특히 RGB 기반 방법에 비해 계산 자원이 훨씬 적게 소요되면서도 대부분의 경우 더 나은 성능을 보였다.
統計
본 연구는 4개의 대규모 수화 인식 벤치마크 데이터셋에서 평가되었다.
제안 모델은 기존 골격 기반 방법들을 크게 능가하는 성능을 달성했다.
제안 모델은 RGB 기반 방법에 비해 계산 자원이 훨씬 적게 소요되면서도 대부분의 경우 더 나은 성능을 보였다.
引用
"현재 방법들은 고정된 그래프 구조 또는 단일 학습 가능 그래프를 사용하여 관절 간 관계를 모델링하지만, 이는 입력 데이터에 따라 동적으로 변화하는 관계를 충분히 반영하지 못한다."
"단순한 시간 컨볼루션을 사용하여 복잡한 인간 동작을 모델링하는 데 한계가 있었다."