Core Concepts
이 논문은 각 추적 시퀀스를 연속 스트림으로 간주하고 다중 프레임 연속 운동 정보를 활용하여 더 robust한 추적을 달성하는 새로운 프레임워크인 StreamTrack을 제안한다.
Abstract
이 논문은 3D 단일 객체 추적(SOT) 문제를 다룬다. 기존 접근법은 주로 외관 매칭 또는 두 연속 프레임 내의 운동 모델링에 의존했지만, 이는 3D 공간에서 객체의 장기 연속 운동 특성을 간과했다.
이 논문은 StreamTrack이라는 새로운 프레임워크를 제안한다. StreamTrack은 각 추적 시퀀스를 연속 스트림으로 간주하고, 현재 프레임만을 입력으로 사용하면서 다중 프레임 과거 특징을 메모리 뱅크에서 가져와 효율적으로 활용한다. 효과적인 프레임 간 메시지 전달을 위해 하이브리드 어텐션 메커니즘을 설계했다. 또한 다중 프레임 특징의 활용도를 높이기 위해 대조적 시퀀스 강화 전략을 제안했다.
실험 결과, StreamTrack은 KITTI, nuScenes, Waymo 데이터셋에서 새로운 최신 성능을 달성했다. 특히 복잡한 트래픽 장면이나 저밀도 포인트 클라우드 환경에서도 뛰어난 성능을 보였다.
Stats
제안된 StreamTrack 모델은 단일 NVIDIA V100 GPU에서 40.7 FPS의 추론 속도를 달성했다.
StreamTrack은 KITTI 데이터셋에서 평균 성공률 70.8%와 정확도 88.1%를 달성했다.
nuScenes 데이터셋에서 StreamTrack은 차량, 보행자, 트럭, 트레일러, 버스 카테고리에서 각각 62.05%, 38.43%, 64.67%, 66.67%, 60.66%의 성공률을 달성했다.
Waymo 데이터셋에서 StreamTrack은 차량과 보행자 카테고리에서 각각 60.23%와 47.07%의 성공률을 달성했다.
Quotes
"우리는 각 추적 시퀀스를 연속 스트림으로 간주하고 다중 프레임 연속 운동 정보를 활용하여 더 robust한 추적을 달성하는 새로운 프레임워크인 StreamTrack을 제안한다."
"효과적인 프레임 간 메시지 전달을 위해 하이브리드 어텐션 메커니즘을 설계했다."
"다중 프레임 특징의 활용도를 높이기 위해 대조적 시퀀스 강화 전략을 제안했다."