核心概念
가시성 정보를 활용하여 중요한 키포인트를 선별적으로 추정함으로써 3D-2D 대응 관계를 개선하고 최종 물체 자세 추정 성능을 향상시킨다.
要約
이 논문은 6DoF 물체 자세 추정을 위한 가시성 인식 키포인트 위치 추정 방법을 제안한다. 기존 방법들은 모든 미리 정의된 키포인트를 추정하지만, 이 중 많은 키포인트가 가시성이 낮아 추정 결과가 불안정하다. 이 문제를 해결하기 위해 저자들은 가시성이 높은 중요한 키포인트만을 선별적으로 추정한다.
구체적으로, 저자들은 객체 수준 어노테이션으로부터 효율적으로 키포인트 가시성 레이블을 생성하는 방법을 제안한다. 외부 가림과 내부 자가 가림을 각각 고려하여 이진 가시성 레이블을 생성한다. 이후 Personalized PageRank 알고리즘을 활용해 실수 값의 가시성 인식 중요도를 계산한다. 이렇게 얻은 중요도를 바탕으로 가시성이 높은 키포인트만을 선별적으로 추정한다.
제안 방법은 기존 최신 키포인트 기반 6DoF 물체 자세 추정 방법인 CheckerPose에 통합되어 성능을 크게 향상시킨다. 실험 결과, 제안 방법은 Linemod, Linemod-Occlusion, YCB-V 데이터셋에서 모두 최신 수준의 성능을 달성한다.
統計
가시성이 높은 키포인트만을 선별적으로 추정함으로써 3D-2D 대응 관계의 품질을 크게 향상시킬 수 있다.
제안 방법은 Linemod 데이터셋에서 ADD(-S) 0.02d 기준 67.4%의 인라이어 비율을 달성하여 기존 방법 대비 크게 향상된 성능을 보인다.
제안 방법은 Linemod-Occlusion 데이터셋에서 ADD(-S) 0.05d 기준 46.2%의 평균 재현율을 달성하여 기존 최고 성능을 넘어선다.
제안 방법은 YCB-V 데이터셋에서 ADD(-S) 84.9%의 평균 성능과 AUC-S 92.3%, AUC(-S) 92.7%를 달성하여 최신 수준의 성능을 보인다.
引用
"가시성 정보는 현재 데이터셋 수집 과정에서 누락되어 있다. 따라서 우리는 가용한 객체 수준 어노테이션으로부터 효율적으로 이진 가시성 레이블을 생성하는 방법을 제안한다."
"가시성 인식 중요도의 유연성을 활용하여, 우리는 가시성 인식 중요도를 최신 자세 추정 알고리즘과 통합하고 추가적인 위치 인코딩을 적용하여 VAPO(Visibility-Aware POse estimator)를 구축한다."
"실험 결과는 VAPO가 키포인트 대응 관계와 최종 추정 자세 모두를 개선하며, 명확하게 최신 수준의 성능을 달성함을 보여준다."