핵심 개념
본 연구는 입력 데이터에 따라 동적으로 관절 간 관계를 구축하고, 복잡한 인간 동작을 효과적으로 모델링하는 새로운 공간-시간 모듈을 제안한다. 이를 통해 기존 방법들을 능가하는 수화 인식 성능을 달성한다.
초록
본 연구는 수화 인식을 위한 새로운 모델 아키텍처를 제안한다. 기존 방법들은 고정된 그래프 구조 또는 단일 학습 가능 그래프를 사용하여 관절 간 관계를 모델링하였지만, 이는 입력 데이터에 따라 동적으로 변화하는 관계를 충분히 반영하지 못했다. 또한 단순한 시간 컨볼루션을 사용하여 복잡한 인간 동작을 포착하지 못했다.
이에 본 연구는 두 가지 핵심 기여를 제안한다:
- 입력 데이터에 따라 동적으로 관절 간 관계를 구축하는 그래프 상관 모듈을 도입한다. 또한 특정 도메인 지식을 반영하기 위해 가상 노드를 추가한다.
- 다양한 시간 스케일의 정보를 병렬적으로 집계하는 새로운 시간 컨볼루션 모듈을 제안한다.
이를 통해 기존 방법들을 능가하는 수화 인식 성능을 달성하였으며, 특히 RGB 기반 방법들에 비해 계산 효율성이 크게 향상되었다.
통계
우리의 방법은 기존 골격 기반 방법들에 비해 WLASL2000 데이터셋에서 51.44%의 정확도를 달성하여 새로운 최고 성능을 기록했다.
우리의 방법은 RGB 기반 방법들에 비해 대부분의 경우 더 높은 정확도를 달성하면서도 계산 자원 사용이 크게 감소했다.
인용구
"우리의 제안 방법은 입력 데이터에 따라 동적으로 관절 간 관계를 구축하고, 복잡한 인간 동작을 효과적으로 모델링할 수 있다."
"우리의 방법은 기존 골격 기반 방법들을 능가하는 수화 인식 성능을 달성하였으며, 특히 RGB 기반 방법들에 비해 계산 효율성이 크게 향상되었다."