Core Concepts
본 연구는 3D 형상 프라이어 정보만을 활용하여 다중 물체의 3D 형상 복원 및 범주 수준의 6자유도 자세 추정을 수행하는 자기 지도 학습 네트워크를 제안한다.
Abstract
본 연구는 3D 형상 복원과 범주 수준의 자세 추정을 동시에 수행하는 자기 지도 학습 네트워크를 제안한다. 주요 내용은 다음과 같다:
관측 점군과 형상 프라이어 간의 상관관계를 학습하기 위해 Prior-Aware Pyramid 3D Point Transformer 모듈을 제안한다. 이 모듈은 SE(3) 등가 특징과 3D 스케일 불변 특징을 모두 학습할 수 있다.
형상 프라이어 정보를 활용하여 사전 학습된 모델을 구축하고, 관측 데이터와 형상 잠재 표현을 활용하여 이 모델을 정제하는 Pretrain-to-Refine 자기 지도 학습 패러다임을 제안한다. 이를 통해 클래스 내 형상 변이 문제를 해결할 수 있다.
4개의 공개 데이터셋과 자체 구축 데이터셋에 대한 실험 결과, 제안 방법이 기존 자기 지도 학습 기반 범주 수준 자세 추정 방법을 크게 능가하며, 일부 완전 지도 학습 기반 방법과도 견줄 만한 성능을 보인다.
Stats
관측 점군과 형상 프라이어 간의 특징 거리 매핑 행렬 D는 다음과 같이 계산된다:
Dij = ||fi - f(r)j||2, ∀fi ∈ Fl+1, ∀f(r)j ∈ Fr
각 관측 점의 전체 거리 νi는 다음과 같이 계산된다:
νi = Σj=1^Nr (Dij), ∀i ∈ {1, 2, ..., N0/2l+1}
형상/관측 잠재 표현 f는 관측 점군 P0와 형상 프라이어 Pr로부터 학습된다.
Quotes
"우리는 형상 프라이어 정보만을 활용하여 다중 물체의 3D 형상 복원 및 범주 수준의 6자유도 자세 추정을 수행하는 자기 지도 학습 네트워크를 제안한다."
"제안 방법은 기존 자기 지도 학습 기반 범주 수준 자세 추정 방법을 크게 능가하며, 일부 완전 지도 학습 기반 방법과도 견줄 만한 성능을 보인다."