Core Concepts
검색 기반 방법을 통해 추가 학습 없이도 세그멘테이션 모델의 어휘를 지속적으로 확장할 수 있다.
Abstract
이 연구는 기존 세그멘테이션 모델들이 새로운 개념을 학습할 때 발생하는 치명적인 망각 문제를 해결하기 위해 제안되었다. 기존 모델들은 특정 데이터셋에 대한 fine-tuning을 통해 성능을 높이지만, 이 과정에서 이전에 학습했던 개념들을 잊어버리는 문제가 발생한다.
이 연구에서는 kNN-CLIP이라는 새로운 방법을 제안한다. kNN-CLIP은 검색 기반 접근법을 사용하여 추가 학습 없이도 모델의 어휘를 지속적으로 확장할 수 있다. 구체적으로 다음과 같은 과정을 거친다:
이미지 특징 추출 및 데이터베이스 구축: 사전 학습된 모델을 사용하여 이미지 특징을 추출하고 이를 데이터베이스에 저장한다.
검색 기반 예측: 새로운 이미지에 대해 CLIP 모델의 예측 결과가 낮은 경우, 데이터베이스에서 가장 유사한 특징을 찾아 이를 활용하여 예측 결과를 보완한다.
이를 통해 모델은 추가 학습 없이도 지속적으로 어휘를 확장할 수 있으며, 기존에 학습했던 개념도 잊지 않는다. 실험 결과 다양한 세그멘테이션 데이터셋에서 기존 모델 대비 큰 성능 향상을 보였다.
Stats
기존 모델 대비 ADE20K 데이터셋에서 mIoU 7.2점 향상
기존 모델 대비 COCO Panoptic 데이터셋에서 mIoU 1.8점 향상
Quotes
"우리의 혁신적인 방법 kNN-CLIP은 추가 학습 없이도 세그멘테이션 모델의 어휘를 지속적으로 확장할 수 있습니다."
"kNN-CLIP은 계산 및 메모리 비용을 최소화하면서도 뛰어난 성능을 보여줍니다."