Core Concepts
MediaPipe Holistic의 손 영역 탐지 방식에 존재하는 중요한 결함을 해결하여 정확도를 높이고 하위 오류를 방지하는 데이터 기반 접근법을 제안합니다.
Abstract
이 논문은 MediaPipe Holistic의 손 영역 관심 영역(ROI) 예측에 존재하는 중요한 결함을 다룹니다. 현재 방식은 손의 평면이 카메라에 평행한 시나리오에 맞춰 설계되어 있어, 다양한 실제 상황에서 부정확성을 초래합니다. 이는 손 키포인트 탐지 정확도를 저하시키고 전신 자세 추정 정확도에도 영향을 미칩니다.
저자는 데이터 기반 접근법을 제안합니다. 추가 손 키포인트와 z 차원을 포함한 향상된 특징 집합을 활용하여 ROI 추정을 개선합니다. 실험 결과, 현재 방식 대비 더 나은 추정치와 높은 Intersection-over-Union을 보여줍니다. 저자는 코드와 최적화 내용을 공개하여 향후 개선을 용이하게 하고 있습니다.
Stats
현재 방식의 최소 IoU는 3%인 반면, 제안 방식의 최소 IoU는 16%로 향상되었습니다.
제안 방식은 중심 위치 오차를 2.51%에서 2.15%로, 크기 오차를 30.37%에서 17.91%로 개선하였습니다.
그러나 회전 오차는 32.08도에서 56.96도로 증가하였습니다.
Quotes
"MediaPipe Holistic의 현재 접근법은 손의 평면이 카메라에 평행한 시나리오에 맞춰 설계되어 있어, 다양한 실제 상황에서 부정확성을 초래합니다."
"저자는 데이터 기반 접근법을 제안하여 ROI 추정을 개선하고, 실험 결과 더 나은 추정치와 높은 Intersection-over-Union을 보여줍니다."