이 논문은 실사 이미지를 확산 모델의 도메인으로 역전시키는 새로운 방법인 ReNoise를 소개한다.
확산 과정은 가우시안 노이즈에서 시작하여 데이터 분포로 점진적으로 탈노이징되는 일련의 단계로 구성된다. 각 단계에서 모델은 현재 노이즈 수준에서 이전 노이즈 수준으로 이동하는 방향을 예측한다.
역전 문제는 주어진 실사 이미지에 대해 이 예측 방향을 역으로 추정하여 최종 가우시안 노이즈를 찾는 것이다. 이는 어려운 문제로, 특히 최근 몇 단계만으로 고품질 이미지를 생성하는 모델의 경우 더욱 그렇다.
ReNoise 기법은 각 역전 단계에서 반복적인 노이징을 수행하여 각 단계의 예측을 개선한다. 이를 통해 더 큰 폭의 역전 단계를 수행할 수 있으며, 동일한 연산량에서도 더 나은 재구성 정확도를 달성할 수 있다.
또한 편집 가능성을 높이기 위해 노이즈 예측 과정을 추가로 최적화한다.
다양한 확산 모델과 샘플러에 대한 실험을 통해 ReNoise 기법의 효과를 검증하였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Daniel Garib... a las arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14602.pdfConsultas más profundas