세그먼트 어닝 모델은 웹 규모의 데이터셋으로 사전 학습되었지만 다양한 하위 세그멘테이션 작업에서 부적절한 성능을 보였다. 우리는 약한 감독 하에서 자기 훈련을 통해 SAM을 적응시켜 일반화 능력을 향상시켰다.
IFSENet은 사용자 클릭을 활용하여 새로운 클래스의 이미지를 효과적으로 세그멘테이션할 수 있는 모델이다. 기존의 Few-shot 세그멘테이션 및 대화형 세그멘테이션 모델의 한계를 극복하고, 두 방법의 장점을 결합하여 적은 노력으로도 높은 정확도를 달성할 수 있다.
제안된 CAT-SAM은 Segment Anything Model의 이미지 인코더와 마스크 디코더를 조건부로 동시에 튜닝하여 다양한 도메인에 대한 데이터 효율적 적응을 달성한다.
SLiMe는 단 하나의 참조 이미지와 해당 이미지의 세그멘테이션 마스크를 활용하여, 다양한 수준의 세그멘테이션을 수행할 수 있다.
클릭 기반 상호작용 이미지 세그멘테이션을 위한 CFR-ICL 프레임워크의 효과적인 성능 증진