핵심 개념
이벤트 카메라와 RGB 카메라의 상호보완적 활용을 통해 다양한 조명 환경과 빠른 움직임 상황에서도 강건한 3D 손 메쉬 복원을 달성할 수 있다.
초록
본 논문은 이벤트 카메라와 RGB 카메라를 활용하여 3D 손 메쉬 복원을 수행하는 EvRGBHand 기법을 제안한다.
-
이벤트 카메라와 RGB 카메라는 각각 장단점을 가지고 있어, 두 센서를 상호보완적으로 활용하면 강건한 3D 손 메쉬 복원이 가능하다.
- 이벤트 카메라는 높은 동적 범위와 빠른 시간 해상도를 가지지만, 텍스처 정보가 부족하다는 단점이 있다.
- RGB 카메라는 풍부한 텍스처 정보를 제공하지만, 강한 조명이나 빠른 움직임 상황에서 성능이 저하된다.
-
EvRGBHand는 공간, 시간, 정보 차원에서 이벤트 스트림과 RGB 프레임을 효과적으로 융합하여 이러한 단점을 극복한다.
- 공간 정렬 모듈을 통해 두 센서 데이터를 정렬하고, 상호보완적 융합 모듈로 장단점을 보완한다.
- 시간 주의 기제를 활용하여 손 움직임의 시공간적 일관성을 활용한다.
-
또한 EvRGBDegrader라는 데이터 증강 기법을 제안하여, 정상 환경에서 학습된 모델이 실외 환경이나 다른 이벤트 카메라에서도 강건하게 동작할 수 있도록 한다.
-
실험 결과, EvRGBHand는 단일 센서 기반 방법들에 비해 다양한 조명 환경과 빠른 움직임 상황에서 우수한 성능을 보였다. 또한 제한된 학습 데이터에도 불구하고 실외 환경과 다른 이벤트 카메라에서 우수한 일반화 성능을 보였다.
통계
RGB 카메라 기반 HMR 방법들은 강한 조명 환경에서 과다 노출 및 모션 블러 문제를 겪는다.
이벤트 카메라 기반 HMR 방법들은 전경 부족 및 배경 오버플로우 문제를 겪는다.
인용구
"이벤트 카메라는 높은 동적 범위와 빠른 시간 해상도 특성으로 인해 매우 유망한 대안이지만, 손 메쉬 복원을 위한 두드러진 텍스처 정보가 부족하다."
"EvRGBHand는 시간, 공간, 정보 차원에서 두 모달리티의 데이터를 융합하여 RGB 기반 HMR의 과다 노출 및 모션 블러 문제와 이벤트 기반 HMR의 전경 부족 및 배경 오버플로우 문제를 해결할 수 있다."