Core Concepts
본 연구는 수동 주석 없이도 참조 기반 객체 계수를 학습할 수 있음을 보여준다. 이를 위해 Self-Collages라는 자체 생성 데이터를 활용하여 모델을 학습시키고, 기존 감독 학습 모델과 유사한 성능을 달성한다.
Abstract
이 논문은 수동 주석 없이도 참조 기반 객체 계수를 학습할 수 있는 방법을 제안한다.
핵심 내용은 다음과 같다:
Self-Collages라는 자체 생성 데이터를 활용하여 모델을 학습시킴
Self-Collages는 배경 이미지에 다양한 객체를 무작위로 붙여 만든 이미지로, 모델이 객체 계수를 학습할 수 있는 신호를 제공함
자기 지도 학습된 DINO 시각 특징을 활용하여 UnCounTR 모델을 구축
실험 결과, UnCounTR은 기존 감독 학습 모델과 유사한 성능을 달성하며, 일부 영역에서는 더 나은 성과를 보임
이를 통해 수동 주석 없이도 참조 기반 객체 계수가 가능함을 입증하였다. 또한 자기 지도 학습된 시각 표현이 이러한 작업에 효과적으로 활용될 수 있음을 보여주었다.
Stats
평균 객체 수가 56개인 FSC-147 데이터셋에서 UnCounTR의 MAE는 35.77, RMSE는 130.34이다.
FSC-147 저밀도 영역(8-16개 객체)에서 UnCounTR의 MAE는 5.60, RMSE는 10.13이다.
MSO 데이터셋에서 UnCounTR의 MAE는 1.07, RMSE는 2.32이다.
CARPK 데이터셋에서 UnCounTR의 MAE는 30.35, RMSE는 35.67이다.