주석 없는 이미지에서 생성된 다양한 뷰를 활용하여 객체 자세 추정기를 학습할 수 있다.
텍스트 프롬프트를 사용하여 관심 객체를 지정하고, 객체 모델이나 비디오 시퀀스 없이도 두 개의 RGBD 뷰포인트에서 객체의 상대적 6D 자세를 추정할 수 있는 새로운 접근 방식을 제안합니다.
PACE는 복잡한 환경에서의 객체 자세 추정을 위한 대규모 벤치마크 데이터셋으로, 기존 데이터셋의 한계를 극복하고 실제 세계에 더 가까운 환경을 제공한다.
GigaPose는 템플릿과 패치 대응의 균형을 통해 속도와 강건성을 모두 달성하는 새로운 RGB 기반 방법입니다.