核心概念
단일 RGB 이미지에서 3D 물체 모델을 이용하여 6-DoF 물체 포즈를 직접 추정하는 단일 단계 접근법을 제안한다. 분류와 회귀 단계를 순차적으로 학습하며, 두 단계 사이의 다중 스케일 잔차 상관 레이어를 통해 분류 결과를 회귀 단계에 효과적으로 전달한다.
摘要
이 논문은 단일 RGB 이미지에서 3D 물체 모델을 이용하여 6-DoF 물체 포즈를 직접 추정하는 단일 단계 접근법을 제안한다.
제안하는 MRC-Net 모델은 두 단계로 구성된다:
- 분류 단계: 입력 이미지를 통해 물체 포즈 클래스를 예측하고, 예측된 포즈로 3D 물체 모델을 렌더링한다.
- 회귀 단계: 렌더링된 이미지와 입력 이미지 간의 다중 스케일 잔차 상관 특징을 이용하여 포즈 잔차를 예측한다.
이러한 순차적 접근법은 분류 결과를 회귀 단계에 직접 활용할 수 있어 성능 향상에 도움이 된다. 또한 대칭 물체의 경우 포즈 클래스에 대한 확률적 soft label을 사용하여 모호성을 해결한다.
실험 결과, 제안 방법은 다양한 BOP 벤치마크 데이터셋에서 기존 방법들을 뛰어넘는 성능을 보였다. 특히 텍스처가 없거나 심한 가림이 있는 경우에도 강건한 성능을 보였다.
统计
단일 RGB 이미지와 3D 물체 모델을 입력으로 사용한다.
출력은 물체의 3D 회전(R) 및 3D 이동(t)으로 구성된 6-DoF 포즈이다.
引用
"우리는 분류와 잔차 회귀 단계를 순차적으로 학습하는 새로운 접근법을 제안한다. 두 단계 사이의 다중 스케일 잔차 상관 레이어를 통해 분류 결과를 회귀 단계에 효과적으로 전달한다."
"대칭 물체의 경우 포즈 클래스에 대한 확률적 soft label을 사용하여 모호성을 해결한다."