Core Concepts
주석 없는 이미지에서 생성된 다양한 뷰를 활용하여 객체 자세 추정기를 학습할 수 있다.
Abstract
이 논문은 객체 자세 주석 없이 범주 수준 객체 자세 추정기를 학습하는 방법을 제안한다. 기존 연구들은 수천 개의 객체 이미지와 주석된 자세가 필요했지만, 이 연구에서는 확산 모델(Zero-1-to-3)을 사용하여 단일 무주석 이미지에서 다양한 뷰의 이미지를 생성하고, 이를 활용하여 객체 자세 추정기를 학습한다.
생성된 이미지에는 노이즈와 아티팩트가 있어 직접 사용하기 어려우므로, 이미지 인코더를 도입하여 불합리한 세부 사항을 제거하고 이미지 특징 맵을 추출한다. 또한 주석된 자세 정보 없이도 생성된 이미지 세트에서 객체 자세를 학습할 수 있는 새로운 학습 전략을 제안한다.
실험 결과, 주석 없이도 단일 샷 설정에서 범주 수준 객체 자세 추정이 가능하며, 기존 최첨단 방법보다 성능이 크게 향상되었다.
Stats
단일 주석 이미지로도 기존 방법보다 Acc30 성능이 더 좋다.
7개의 주석 이미지로 학습한 경우에도 우리 모델의 성능이 더 좋다.
Quotes
"주석 없이도 단일 샷 설정에서 범주 수준 객체 자세 추정이 가능하다."
"기존 최첨단 방법보다 성능이 크게 향상되었다."