Core Concepts
제한된 예시를 이용하여 기존 클래스와 새로운 클래스를 동시에 정확하게 분할할 수 있는 학습 가능한 프롬프트 기반 방법론을 제안한다.
Abstract
이 논문은 제한된 예시를 이용한 일반화된 의미 분할 문제를 다룬다. 이를 위해 다음과 같은 접근법을 제안한다:
SegGPT를 기반 모델로 사용하여 기존 클래스를 학습한다.
새로운 클래스에 대해서는 학습 가능한 프롬프트를 사용하여 개별적으로 예측한다. 이를 통해 새로운 클래스 추가가 기존 클래스 성능을 저하시키지 않는다.
원격 탐사 영역의 다양한 객체 크기를 고려하기 위해 패치 기반 예측을 수행한다.
패치 간 불연속성을 해결하기 위해 패치-앤-스티치 기법을 제안한다. 이는 이미지 복원 문제로 재정의된다.
추론 시 이미지 유사도 검색을 활용하여 프롬프트를 선택하고 새로운 클래스 필터링을 수행한다.
실험 결과, 제안 방법은 단순 fine-tuning 대비 약 2배 이상의 성능 향상을 보였다.
Stats
제안 방법은 기존 SegGPT 모델 대비 mIoU를 15.96에서 35.08로 향상시켰다.
학습 가능한 프롬프트 도입으로 mIoU가 7.44 증가했다.
패치-앤-스티치 기법 적용으로 mIoU가 4.15 증가했다.
새로운 클래스 필터링으로 mIoU가 5.67 증가했다.
Quotes
"제한된 예시를 이용하여 기존 클래스와 새로운 클래스를 동시에 정확하게 분할할 수 있는 학습 가능한 프롬프트 기반 방법론을 제안한다."
"원격 탐사 영역의 다양한 객체 크기를 고려하기 위해 패치 기반 예측을 수행한다."
"패치 간 불연속성을 해결하기 위해 패치-앤-스티치 기법을 제안한다."