DINO-Tracker는 사전 학습된 DINO-ViT 모델의 강력한 지역화된 의미 특징을 활용하여, 단일 동영상에서 장기 밀집 추적을 수행합니다. 이를 위해 테스트 시간 학습과 특징 최적화를 결합하여, 자기 지도 학습 손실 함수를 통해 모델을 학습합니다.