이 논문은 맥락 기반 매트팅이라는 새로운 이미지 매트팅 과제를 소개한다. 맥락 기반 매트팅은 참조 이미지와 사용자 제공 프라이어로 동일한 객체 범주의 타겟 이미지 배치에 대한 자동 알파 매트 추출을 가능하게 한다. 이는 보조 입력 기반 매트팅의 정확성과 자동 매트팅의 편의성을 결합한 접근법이다.
핵심 과제는 참조 입력을 활용하여 타겟 객체를 정확하게 매칭하는 것이다. 이를 위해 저자들은 사전 학습된 텍스트-이미지 확산 모델인 Stable Diffusion을 활용한 IconMatting 모델을 제안한다. IconMatting은 참조 이미지와 타겟 이미지 간 유사성 매칭과 타겟 이미지 내부 유사성을 활용하여 타겟 객체에 대한 정확한 가이드 맵을 생성한다. 이를 통해 최종적으로 타겟 이미지의 알파 매트를 예측한다.
저자들은 새로운 평가 데이터셋 ICM-57을 구축하여 맥락 기반 매트팅 모델을 평가하였다. 실험 결과, IconMatting은 자동 매트팅 수준의 편의성을 유지하면서도 트라이맵 기반 매트팅 모델과 견줄만한 정확도를 달성하였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문