Core Concepts
본 논문은 DETR 기반 반자동 객체 탐지 프레임워크의 한계를 해결하기 위해 쿼리 개선 모듈과 신뢰할 수 있는 의사 레이블 필터링 모듈을 제안한다. 이를 통해 작은 객체 및 가려진 객체의 탐지 성능을 크게 향상시킨다.
Abstract
본 논문은 DETR 기반 반자동 객체 탐지 프레임워크의 한계를 해결하기 위한 Sparse Semi-DETR을 제안한다.
- 쿼리 개선 모듈:
- 약한 증강 이미지와 강한 증강 이미지에서 추출한 특징을 융합하여 쿼리 특징을 개선
- 주의 메커니즘을 통해 의미적 표현을 강화하여 작은 객체 및 가려진 객체의 탐지 성능 향상
- 신뢰할 수 있는 의사 레이블 필터링 모듈:
- 높은 품질의 의사 레이블을 선별적으로 필터링하여 탐지 정확도와 일관성 향상
실험 결과, Sparse Semi-DETR은 MS-COCO와 Pascal VOC 벤치마크에서 기존 최신 방법들을 크게 능가하는 성능을 보였다. 특히 작은 객체 및 가려진 객체의 탐지 성능이 크게 향상되었다.
Stats
작은 객체 탐지 성능에서 Semi-DETR 대비 1.2, 0.9, 1.7 mAP 향상 (1%, 5%, 10% 레이블 데이터)
10% 레이블 데이터에서 44.3 mAP 달성, 기존 최신 방법 대비 0.8 mAP 향상
Quotes
"Sparse Semi-DETR incorporates a Query Refinement Module to enhance the quality of object queries, significantly improving detection capabilities for small and partially obscured objects."
"We introduce a Reliable Pseudo-Label Filtering Module that selectively filters high-quality pseudo-labels, thereby enhancing detection accuracy and consistency."