이 논문은 안정 확산 모델의 자기 주의 층에 내재된 객체 그룹화 정보를 활용하여 무감독 제로샷 이미지 세그멘테이션 방법인 DiffSeg를 제안한다.
DiffSeg는 다음 3단계로 구성된다:
DiffSeg는 COCO-Stuff-27과 Cityscapes 벤치마크에서 기존 무감독 제로샷 SOTA 방법을 크게 능가하는 성능을 보였다. 또한 다양한 스타일의 이미지에 대해서도 일반화 능력이 뛰어났다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Junjiao Tian... a las arxiv.org 04-03-2024
https://arxiv.org/pdf/2308.12469.pdfConsultas más profundas