본 연구는 객체 중심 표현을 활용하여 다양한 객체와 다양한 하위 작업을 통합적으로 학습할 수 있는 새로운 분리된 객체 중심 트랜스포머(DOCTR) 모델을 제안한다. DOCTR는 의미 정보와 기하학적 정보를 별도로 학습할 수 있는 의미-기하 분리 쿼리(SGDQ) 설계를 통해 다양한 하위 작업을 효과적으로 수행할 수 있다.