이 논문은 반감독 군중 계수 문제를 다룹니다. 기존 방법들은 레이블이 없는 데이터에서 신뢰할 수 있는 예측을 선별하여 모델의 정확도를 높이는 데 초점을 맞추었지만, 이로 인해 모델이 지역 패치에 과도하게 의존하게 되는 문제가 있었습니다.
저자들은 이 문제를 해결하기 위해 마스킹 기법을 사용하여 모델이 전체적인 맥락 정보를 활용하도록 유도합니다. 구체적으로, 레이블이 없는 데이터의 일부 패치를 가린 후 교사 모델이 제공하는 감독 신호를 통해 학생 모델이 가려진 부분을 예측하게 합니다. 이를 통해 모델이 지역 정보에 과도하게 의존하는 것을 방지하고 장면에 대한 전체적인 이해를 높일 수 있습니다.
또한 저자들은 회귀 작업과 분류 작업을 함께 수행하여 특징 표현의 다양성을 높이고 밀도 관계를 모델링하는 것이 중요함을 보여줍니다.
실험 결과, 제안 방법은 기존 최신 기법들을 크게 능가하는 성능을 보여줍니다. 특히 UCF-QNRF 데이터셋에서 평균 절대 오차와 평균 제곱 오차가 각각 13.2%와 14.8% 감소했습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문