본 연구는 다중 사람 3D 자세 추정을 위한 새로운 접근법을 제안한다. 제안하는 방법은 3단계로 구성된다:
2D 스켈레톤 검출: 기존의 효율적인 2D 스켈레톤 검출기를 활용한다.
다중 뷰 스켈레톤 매칭: 그래프 신경망(GNN)을 사용하여 다중 뷰에서 검출된 스켈레톤들을 매칭한다. 이 단계는 자기 지도 학습 방식으로 학습되어 레이블이 필요 없다.
3D 자세 추정: 다중 계층 퍼셉트론(MLP)을 사용하여 2D 스켈레톤 정보로부터 3D 자세를 추정한다. 이 단계 또한 자기 지도 학습 방식으로 학습되어 레이블이 필요 없다.
제안하는 방법은 기존 접근법에 비해 빠르고 정확하며, 특히 레이블이 필요 없다는 장점이 있다. 실험 결과, CMU Panoptic 데이터셋과 Aston University의 자율 로봇 및 인지 실험실에서 수집한 데이터셋에서 우수한 성능을 보였다. 또한 제안하는 방법은 모바일 로봇에 적용될 수 있음을 보였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문