이 논문은 확산 모델을 활용하여 고해상도 이미지를 생성하는 방법을 제안한다. 기존의 해결책들은 모델 구조 변경, 추가 학습 또는 다단계 샘플링 과정을 필요로 했지만, 이 논문에서 제안하는 업샘플 가이던스 기법은 사전 학습된 모델에 단 하나의 추가 항을 더하는 것만으로도 고해상도 이미지를 생성할 수 있다.
업샘플 가이던스는 픽셀 공간, 잠재 공간, 비디오 확산 모델 등 다양한 모델에 적용될 수 있으며, 기존에 제안된 기법들과도 호환된다. 또한 CIFAR-10과 같이 저해상도 데이터셋으로 학습된 모델에서도 고해상도 이미지를 생성할 수 있다는 점이 주목할 만하다.
실험 결과, 업샘플 가이던스를 적용하면 다양한 모델, 해상도, 조건 생성 방식에서 일관되게 향상된 이미지 품질을 얻을 수 있었다. 특히 여러 피사체가 생성되거나 해부학적 오류가 있는 경우 등의 문제를 효과적으로 해결하였다. 추가 계산 비용도 최소화되어 실용적인 수준이다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania