Concepts de base
본 논문은 프롬프트 기반 동적 클래스 인식 기법을 제안하여 적은 수의 지원 이미지로도 효과적으로 미지의 클래스를 세분화할 수 있다.
Résumé
본 논문은 Few-shot Segmentation (FSS) 문제를 해결하기 위해 프롬프트 기반의 동적 클래스 인식 기법을 제안한다. 기존 FSS 방법들은 고정된 특징 인코더를 사용하여 클래스 비특정적인 특징을 추출하는 한계가 있었다. 이에 반해 본 논문은 인간의 시각 인지 패턴을 모방하여 프롬프트를 통해 인코더를 동적으로 조정하여 관심 클래스의 객체에 집중할 수 있도록 한다.
구체적으로 본 논문은 다음 3가지 핵심 기술을 제안한다:
- 언어 모델을 활용하여 프롬프트에 초기 클래스 인식 정보를 부여한다.
- 의미 프롬프트 전이 기법을 통해 지원 및 질의 이미지의 클래스 특정 의미를 프롬프트에 전이한다.
- 부분 마스크 생성기를 통해 다양한 부분 프롬프트를 생성하여 프롬프트의 의미적 다양성을 높인다.
이를 통해 본 논문의 프롬프트 기반 동적 클래스 인식 기법은 4가지 FSS 과제(표준 FSS, 도메인 간 FSS, 약 레이블 FSS, 제로샷 세그멘테이션)에서 11개 벤치마크에 걸쳐 새로운 최고 성능을 달성하였다.
Stats
본 논문의 프롬프트 기반 동적 클래스 인식 기법은 4가지 FSS 과제에서 11개 벤치마크에 걸쳐 새로운 최고 성능을 달성하였다.
표준 FSS 과제에서 PASCAL-5i 데이터셋의 1-shot 및 5-shot 설정에서 각각 71.66%, 78.01%의 mIoU 성능을 달성하였다.
COCO-20i 데이터셋의 1-shot 및 5-shot 설정에서 각각 52.91%, 57.98%의 mIoU 성능을 달성하였다.
iSAID 데이터셋의 1-shot 및 5-shot 설정에서 각각 48.72%, 53.38%의 mIoU 성능을 달성하였다.
Citations
"본 논문은 인간의 시각 인지 패턴을 모방하여 프롬프트를 통해 인코더를 동적으로 조정하여 관심 클래스의 객체에 집중할 수 있도록 한다."
"본 논문의 프롬프트 기반 동적 클래스 인식 기법은 4가지 FSS 과제에서 11개 벤치마크에 걸쳐 새로운 최고 성능을 달성하였다."