이 논문은 최근 주목받고 있는 잠재 확산 모델(LDM)을 활용한 이미지 조작 기법인 역 확산 샘플링과 점수 증류 방법을 통합한 DreamSampler 프레임워크를 소개합니다.
역 확산 샘플링은 LDM 아키텍처 조정이나 특징 공학이 필요한 반면, 점수 증류는 모델 독립적이지만 모드 붕괴에 취약한 단점이 있습니다. DreamSampler는 이 두 접근법의 장점을 활용하여 정규화된 잠재 최적화 관점에서 통합하였습니다.
구체적으로 DreamSampler는 Tweedie 공식을 통해 역 확산 샘플링 과정을 후험 평균 근사로 해석하였고, 이를 통해 측정 일관성 등의 추가 정규화 항을 도입할 수 있습니다. 또한 점수 증류 손실이 이러한 근사 문제와 동등함을 보여 두 접근법의 자연스러운 통합을 달성하였습니다.
이를 바탕으로 DreamSampler는 이미지 편집, SVG 복원, 이미지 복원 등 다양한 응용 분야에서 기존 방법 대비 경쟁력 있는 성능을 보였습니다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Jeongsol Kim... kl. arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11415.pdfDybere Forespørgsler