核心概念
본 연구는 DINOv2의 SE(3) 일관된 의미 특징과 계층적 기하학적 특징을 융합하여 범주 수준 자세 추정 성능을 크게 향상시킨다.
摘要
본 논문은 범주 수준 물체 자세 추정을 위한 SecondPose 방법을 제안한다. SecondPose는 DINOv2의 의미 특징과 계층적 기하학적 특징을 융합하여 SE(3) 일관된 객체 표현을 구축한다.
구체적으로:
- DINOv2 모델을 사용하여 의미 특징을 추출하고, 계층적 패널 기반 점 쌍 특징(HP-PPF)을 통해 기하학적 특징을 추출한다.
- 추출된 특징들을 SE(3) 일관된 방식으로 융합하여 객체 표현을 생성한다.
- 이렇게 생성된 통합 객체 표현을 사용하여 최종적으로 물체의 9DoF 자세를 추정한다.
실험 결과, SecondPose는 NOCS-REAL275 및 HouseCat6D 데이터셋에서 기존 최신 기술 대비 큰 성능 향상을 보였다. 특히 다양한 형태의 물체에 대해 강건한 성능을 보였다.
統計資料
물체의 3D 회전, 3D 이동, 3D 크기 등 9DoF 자세를 추정한다.
NOCS-REAL275 데이터셋에서 5°2cm 지표 기준 56.2%의 정확도를 달성했다.
HouseCat6D 데이터셋에서 평균 IoU 50% 기준 73.0%의 정확도를 달성했다.
引述
"DINOv2의 패치 단위 SE(3) 일관된 의미 특징을 활용하여 객체 표현의 SE(3) 일관성을 확보한다."
"계층적 기하학적 특징 추출을 통해 객체의 지역적-전역적 구조 정보를 효과적으로 인코딩한다."
"SE(3) 일관된 객체 표현을 통해 자세 추정 과정을 단순화하고 정확도를 향상시킨다."