DepthMOT는 다중 객체 추적(MOT) 문제에 깊이 정보를 활용하는 방법을 제안한다. 기존 MOT 방법들은 2D 경계 상자만을 사용하여 객체를 표현하므로 겹치는 객체들을 구분하기 어려운 문제가 있다. DepthMOT는 장면의 깊이 정보를 추정하여 이를 해결한다.
구체적으로, DepthMOT는 FairMOT 모델을 기반으로 하며, 깊이 추정 브랜치와 카메라 자세 추정 브랜치를 추가로 포함한다. 깊이 추정 브랜치는 다중 스케일 특징을 활용하여 장면의 깊이 지도를 예측한다. 이를 통해 겹치는 객체들의 깊이 정보를 활용하여 구분할 수 있다. 또한 카메라 자세 추정 브랜치는 불규칙한 카메라 움직임에 의한 오차를 보정한다.
실험 결과, DepthMOT는 VisDrone-MOT와 UAVDT 데이터셋에서 SOTA 성능을 달성하였다. 깊이 정보 활용과 카메라 자세 보정이 다중 객체 추적 성능 향상에 효과적임을 보여준다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jiapeng Wu,Y... at arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05518.pdfDeeper Inquiries