실시간 시각 기반 포즈 회귀 및 위치 추정을 위한 역가능 신경망 PoseINN
카메라 포즈 추정은 모바일 로봇 및 증강현실 등의 분야에서 중요한 문제이다. 기존 최신 모델들은 정확도가 높지만 계산 비용이 높다. 본 논문에서는 역가능 신경망(INN)을 사용하여 이미지 잠재 공간과 포즈 간의 매핑을 찾는 PoseINN 모델을 제안한다. 이 모델은 최신 모델과 유사한 성능을 보이면서도 훈련 속도가 빠르고 저해상도 합성 데이터만으로도 학습이 가능하다. 또한 정규화 흐름을 사용하여 출력에 대한 불확실성 추정도 제공한다.