본 연구는 RGB 기반 및 다중 모달 객체 추적을 위한 새로운 통합 시퀀스-투-시퀀스 학습 프레임워크를 제안한다. 이를 통해 복잡한 헤드 네트워크와 다양한 손실 함수가 필요한 기존 방식의 단점을 해결하고, 단일 및 다중 모달 추적 작업을 통합적으로 처리할 수 있다.
OneTracker은 RGB 추적과 RGB+X 추적 작업을 통합하는 일반적인 프레임워크를 제시합니다. 이를 위해 Foundation Tracker를 통한 대규모 사전 학습과 Prompt Tracker를 통한 매개변수 효율적인 미세 조정을 수행합니다.