본 연구는 수화 인식을 위한 새로운 모델을 제안한다. 기존 방법들은 고정된 그래프 구조 또는 단일 학습 가능 그래프를 사용하여 관절 간 관계를 모델링하였지만, 이는 입력 데이터에 따라 동적으로 변화하는 관계를 충분히 반영하지 못했다. 또한 단순한 시간 컨볼루션을 사용하여 복잡한 인간 동작을 모델링하는 데 한계가 있었다.
이에 본 연구는 다음과 같은 두 가지 핵심 기여를 제안한다:
이러한 공간-시간 모듈의 장점을 통해, 본 연구는 4개의 대규모 수화 인식 벤치마크에서 최신 기술 수준을 달성하였다. 특히 RGB 기반 방법에 비해 뛰어난 정확도와 계산 효율성을 보여주었다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Lianyu Hu,Li... klo arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12519.pdfSyvällisempiä Kysymyksiä