이 논문은 수화 인식을 위한 새로운 방법을 제안한다. 기존 방법들은 고정된 그래프 구조 또는 단일 학습 가능한 그래프를 사용하여 관절 간 관계를 부분적으로만 탐색하고, 단순한 시간 컨볼루션을 사용하여 복잡한 움직임 패턴을 충분히 모델링하지 못했다.
이를 해결하기 위해 본 연구는 다음과 같은 두 가지 핵심 기여를 제안한다:
그래프 상관 모듈: 입력 데이터에 따라 동적으로 관절 간 관계를 구축하여 유용한 공간 특징을 포착한다. 또한 특정 도메인 지식을 반영하기 위해 가상 노드를 추가한다.
병렬 시간 컨볼루션 모듈: 다양한 크기의 시간 컨볼루션 커널을 병렬로 적용하여 복잡한 시간적 움직임을 효과적으로 모델링한다.
제안 방법은 4개의 대규모 수화 인식 벤치마크에서 최신 기술 대비 우수한 성능을 달성했다. 특히 RGB 기반 방법보다 높은 정확도를 보이면서도 계산 자원 사용이 훨씬 적어 실용성이 높다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Lianyu Hu,Li... às arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12519.pdfPerguntas Mais Profundas