Core Concepts
소수 샷 객체 탐지를 위해 세부적인 프로토타입을 증류하여 더 강력한 새로운 객체 탐지를 가능하게 하는 방법
Abstract
이 논문은 소수 샷 객체 탐지(FSOD) 문제를 다룹니다. FSOD는 새로운 객체 클래스에 대해 소수의 학습 예시만 있는 상황에서 일반적인 객체 탐지기를 확장하는 것을 목표로 합니다.
메타 러닝 기반 방법은 이 문제에 효과적인 것으로 입증되었습니다. 일반적으로 메타 러닝 기반 방법은 새로운 예시(지원 이미지)를 클래스 프로토타입으로 인코딩하는 추가적인 지원 브랜치를 사용합니다. 이 프로토타입은 쿼리 브랜치와 융합되어 모델 예측을 돕습니다.
그러나 클래스 수준의 프로토타입을 정확하게 생성하기 어려우며, 세부적인 정보도 부족하여 성능 불안정성이 발생합니다. 따라서 더 강력한 새로운 객체 탐지를 위해서는 세부적인 지역 문맥을 포착할 수 있는 새로운 방법이 필요합니다.
이를 위해 저자들은 가장 대표적인 지원 특징을 세부적인 프로토타입으로 증류하는 방법을 제안합니다. 이 프로토타입은 쿼리 특징 맵에 할당되어 두 브랜치 간의 세부적인 특징 관계를 모델링합니다. 이 과정은 세부적인 특징 집계(FFA) 모듈을 통해 구현됩니다.
또한 고수준 특징 융합 측면에서, 균형 잡힌 클래스 무관 샘플링(B-CAS) 전략과 비선형 융합(NLF) 모듈을 제안합니다. 이 두 가지 방법은 상호 보완적이며 고수준 특징 관계를 더 효과적으로 나타낼 수 있습니다.
광범위한 실험을 통해 제안 방법이 대부분의 설정에서 새로운 최첨단 성능을 달성한다는 것을 보여줍니다.
Stats
새로운 객체 클래스에 대해 소수의 학습 예시만 있는 상황에서도 일반적인 객체 탐지기를 확장할 수 있다.
세부적인 프로토타입을 증류하여 더 강력한 새로운 객체 탐지를 가능하게 한다.
균형 잡힌 클래스 무관 샘플링 전략과 비선형 융합 모듈을 통해 고수준 특징 관계를 더 효과적으로 모델링할 수 있다.
제안 방법은 대부분의 설정에서 새로운 최첨단 성능을 달성한다.
Quotes
"소수 샷 객체 탐지(FSOD)는 데이터 부족 시나리오에서 객체를 탐지하는 더 도전적인 과제이다."
"메타 러닝 기반 방법은 새로운 과제를 빠르게 학습하는 방법을 배우는 아이디어를 따른다."
"세부적인 지역 문맥을 포착할 수 있는 새로운 방법이 필요하다."