Core Concepts
다중 카메라 능동 시각 시스템을 활용하여 제한적이고 가려진 시야에서도 인간의 자세와 위치를 정확하게 감지할 수 있는 통합 인간 감지 전략을 제안한다.
Abstract
이 연구에서는 다중 카메라 능동 시각 시스템(MCAV)을 활용하여 인간-로봇 상호작용 환경에서 인간의 상태를 종합적으로 감지하는 방법을 제안한다.
먼저, MCAV는 각 카메라를 능동적으로 회전시켜 중요 영역을 집중적으로 포착할 수 있다. 이를 통해 단일 고정 카메라에 비해 제한적이고 가려진 시야를 극복할 수 있다.
다음으로, 계층적으로 연결된 트리 구조를 활용하여 다중 소스의 시각 정보를 통합한다. 이 구조는 해부학적 제약 조건을 유지하면서 단계적으로 인간 자세를 추정할 수 있다. 특히, 가려진 부분이나 국소적인 시야에서도 강인한 키포인트 및 키파트 추출 방법을 제안한다.
실험 결과, 제안 방법은 단일 고정 카메라 대비 키파트 인식 정확도를 69.20%에서 90.10%로 향상시켰다. 또한 장애물 회피 성공률도 100%를 달성하여, 인간-로봇 상호작용의 안전성을 크게 개선하였다.
Stats
키포인트 3D 위치 추정 식:
¯p∗
k = arg min
¯p∗
k
X
k∈Ki
ck,i∥T W
Ci ˆ¯pCi
k − ˆ¯p∗
k∥2
키파트 존재 여부 판단 식:
Ej =
sgn
PM
m=0 γmc(j),[tn−m]−α
+1
2
Quotes
"다중 카메라 능동 시각 시스템을 활용하여 제한적이고 가려진 시야에서도 인간의 자세와 위치를 정확하게 감지할 수 있는 통합 인간 감지 전략을 제안한다."
"실험 결과, 제안 방법은 단일 고정 카메라 대비 키파트 인식 정확도를 69.20%에서 90.10%로 향상시켰다. 또한 장애물 회피 성공률도 100%를 달성하여, 인간-로봇 상호작용의 안전성을 크게 개선하였다."