이 논문은 단일 RGB 이미지에서 3D 손 메시를 복원하는 새로운 방법인 HandSSCA를 제안한다. 기존 방법들은 추가 정보를 도입하거나 주의 집중 메커니즘을 사용하여 성능을 높였지만, 계산 복잡도가 증가하는 문제가 있었다. 이에 저자들은 계산 효율성을 유지하면서도 성능을 향상시킬 수 있는 새로운 아키텍처를 제안했다.
HandSSCA는 상태 공간 모델링을 손 자세 추정 분야에 처음 도입했다. 이 네트워크에는 공간과 채널 차원에서 병렬로 스캔하는 새로운 상태 공간 채널 주의 집중 모듈이 포함되어 있다. 이를 통해 효과적인 감지 범위를 확장하고 손 영역 특징을 강화할 수 있다.
실험 결과, HandSSCA는 FREIHAND, DEXYCB, HO3D 데이터셋에서 최첨단 성능을 달성하면서도 매우 적은 수의 매개변수를 사용한다. 이는 제안된 방법이 손-물체 상호작용이 심각한 상황에서도 효과적으로 손 자세를 추정할 수 있음을 보여준다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Zixun Jiao,X... at arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.01066.pdfDeeper Inquiries