이 논문은 안정 확산 모델의 자기 주의 층에 내재된 객체 그룹화 정보를 활용하여 무감독 제로샷 이미지 세그멘테이션 방법인 DiffSeg를 제안한다.
DiffSeg는 다음 3단계로 구성된다:
DiffSeg는 COCO-Stuff-27과 Cityscapes 벤치마크에서 기존 무감독 제로샷 SOTA 방법을 크게 능가하는 성능을 보였다. 또한 다양한 스타일의 이미지에 대해서도 일반화 능력이 뛰어났다.
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Junjiao Tian... ที่ arxiv.org 04-03-2024
https://arxiv.org/pdf/2308.12469.pdfสอบถามเพิ่มเติม