어떤 점이든 추적할 수 있는 트랜스포머 기반 탐지 프레임워크
본 논문에서는 트랜스포머 기반의 간단하고 강력한 모델인 TAPTR을 제안한다. 각 프레임에서 추적 대상 점은 위치와 내용 정보로 구성된 쿼리로 표현되며, 이 쿼리는 레이어 간 업데이트를 통해 점진적으로 개선된다. 같은 추적 대상 점에 해당하는 쿼리들은 시간 차원의 자기 주의 메커니즘을 통해 정보를 교환할 수 있다. 이러한 DETR 기반 설계를 통해 모델이 개념적으로 매우 단순하면서도 강력한 성능을 보인다.