Core Concepts
DETR 변형 모델의 성능 향상을 위해 콘텐츠 쿼리 초기화와 유사 쿼리 집계 기법을 제안한다.
Abstract
이 논문은 DETR 변형 모델의 성능 향상을 위한 두 가지 핵심 기술을 제안한다:
Self-Adaptive Content Query (SACQ) 모듈
트랜스포머 인코더의 특징을 활용하여 콘텐츠 쿼리를 생성하는 모듈
입력 이미지에 적응적으로 콘텐츠 쿼리를 생성하여 타겟 객체에 더 잘 집중할 수 있게 함
Query Aggregation (QA) 전략
SACQ 모듈이 생성한 유사한 예측 결과를 병합하는 전략
한 개의 객체에 대해 여러 개의 고품질 예측 결과가 생성되는 것을 활용하여 최적화 과정의 안정성을 높임
저자들은 COCO 데이터셋에서 6가지 DETR 변형 모델을 대상으로 실험을 진행했으며, 평균 1.0 AP 이상의 성능 향상을 달성했다. 제안 기술은 DETR 기반 객체 탐지 모델의 성능을 높이는 데 효과적이다.
Stats
기존 Deformable-DETR 대비 1.5 AP 향상 (45.4 → 46.9)
기존 두 단계 Deformable-DETR 대비 1.1 AP 향상 (46.2 → 47.3)
기존 SAM-DETR 대비 1.2 AP 향상 (41.8 → 43.0)
기존 SAP-DETR 대비 1.4 AP 향상 (43.1 → 44.5)
기존 DAB-DETR 대비 1.0 AP 향상 (42.2 → 43.2)
기존 DINO 대비 0.4 AP 향상 (49.0 → 49.4)
Quotes
"SACQ 모듈은 입력 이미지에 적응적으로 콘텐츠 쿼리를 생성하여 타겟 객체에 더 잘 집중할 수 있게 한다."
"QA 전략은 SACQ 모듈이 생성한 유사한 예측 결과를 병합하여 최적화 과정의 안정성을 높인다."