이 논문은 확산 모델을 활용하여 고해상도 이미지를 생성하는 방법을 제안한다. 기존의 해결책들은 모델 구조 변경, 추가 학습 또는 다단계 샘플링 과정을 필요로 했지만, 이 논문에서 제안하는 업샘플 가이던스 기법은 사전 학습된 모델에 단 하나의 추가 항을 더하는 것만으로도 고해상도 이미지를 생성할 수 있다.
업샘플 가이던스는 픽셀 공간, 잠재 공간, 비디오 확산 모델 등 다양한 모델에 적용될 수 있으며, 기존에 제안된 기법들과도 호환된다. 또한 CIFAR-10과 같이 저해상도 데이터셋으로 학습된 모델에서도 고해상도 이미지를 생성할 수 있다는 점이 주목할 만하다.
실험 결과, 업샘플 가이던스를 적용하면 다양한 모델, 해상도, 조건 생성 방식에서 일관되게 향상된 이미지 품질을 얻을 수 있었다. 특히 여러 피사체가 생성되거나 해부학적 오류가 있는 경우 등의 문제를 효과적으로 해결하였다. 추가 계산 비용도 최소화되어 실용적인 수준이다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Juno Hwang,Y... um arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01709.pdfTiefere Fragen