본 논문은 Few-shot Segmentation (FSS) 문제를 해결하기 위해 프롬프트 기반의 동적 클래스 인식 기법을 제안한다. 기존 FSS 방법들은 고정된 특징 인코더를 사용하여 클래스 비특정적인 특징을 추출하는 한계가 있었다. 이에 반해 본 논문은 인간의 시각 인지 패턴을 모방하여 프롬프트를 통해 인코더를 동적으로 조정하여 관심 클래스의 객체에 집중할 수 있도록 한다.
구체적으로 본 논문은 다음 3가지 핵심 기술을 제안한다:
이를 통해 본 논문의 프롬프트 기반 동적 클래스 인식 기법은 4가지 FSS 과제(표준 FSS, 도메인 간 FSS, 약 레이블 FSS, 제로샷 세그멘테이션)에서 11개 벤치마크에 걸쳐 새로운 최고 성능을 달성하였다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Hanbo Bi, Yi... kl. arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10389.pdfDybere Forespørgsler