이 논문은 소수 샷 객체 탐지(Few-Shot Object Detection, FSOD) 문제에서 발생하는 클래스 혼동과 망각 문제를 해결하기 위한 새로운 접근법인 SMILe 프레임워크를 제안한다.
SMILe은 다음과 같은 핵심 특징을 가진다:
객체 클래스를 집합으로 모델링하고 집합 기반 조합 함수를 학습 목적으로 사용한다. 이를 통해 기존 접근법의 한계를 극복할 수 있다.
하위 모듈러 상호 정보(Submodular Mutual Information, SMI) 함수를 도입하여 기저 클래스와 새로운 클래스 간의 특징 중복을 최소화한다. 이를 통해 클래스 혼동을 해결한다.
총 하위 모듈러 정보(Total Submodular Information) 최소화를 통해 각 클래스 내부의 특징 다양성을 유지하여 망각 문제를 해결한다.
제안된 SMILe 프레임워크는 기존 FSOD 접근법에 적용 가능하며, PASCAL-VOC와 MS-COCO 벤치마크에서 최신 기술 대비 향상된 성능을 보인다.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Anay Majee, ... : arxiv.org 09-18-2024
https://arxiv.org/pdf/2407.02665.pdfDaha Derin Sorular