이 논문은 최근 주목받고 있는 잠재 확산 모델(LDM)을 활용한 이미지 조작 기법인 역 확산 샘플링과 점수 증류 방법을 통합한 DreamSampler 프레임워크를 소개합니다.
역 확산 샘플링은 LDM 아키텍처 조정이나 특징 공학이 필요한 반면, 점수 증류는 모델 독립적이지만 모드 붕괴에 취약한 단점이 있습니다. DreamSampler는 이 두 접근법의 장점을 활용하여 정규화된 잠재 최적화 관점에서 통합하였습니다.
구체적으로 DreamSampler는 Tweedie 공식을 통해 역 확산 샘플링 과정을 후험 평균 근사로 해석하였고, 이를 통해 측정 일관성 등의 추가 정규화 항을 도입할 수 있습니다. 또한 점수 증류 손실이 이러한 근사 문제와 동등함을 보여 두 접근법의 자연스러운 통합을 달성하였습니다.
이를 바탕으로 DreamSampler는 이미지 편집, SVG 복원, 이미지 복원 등 다양한 응용 분야에서 기존 방법 대비 경쟁력 있는 성능을 보였습니다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jeongsol Kim... lúc arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11415.pdfYêu cầu sâu hơn