본 논문은 확산 모델과 GAN을 결합하여 고품질의 단일 단계 이미지 합성을 가능하게 하는 YOSO 모델을 소개한다.
주요 내용은 다음과 같다:
YOSO는 확산 과정과 GAN을 결합하여 단일 단계 이미지 합성을 가능하게 한다. 기존 확산 GAN 모델들은 오염된 데이터 분포에 대한 적대적 발산을 학습하지만, YOSO는 자기 생성 데이터를 활용하여 깨끗한 데이터 분포에 대한 적대적 발산을 학습한다. 이를 통해 단일 단계 생성 모델을 효과적으로 학습할 수 있다.
YOSO를 사전 학습된 텍스트-이미지 확산 모델에 적용하여 고품질의 단일 단계 텍스트-이미지 합성을 가능하게 한다. 이를 위해 잠재 공간 손실, 잠재 판별기 등의 기법을 활용한다.
YOSO는 단일 단계 이미지 합성 뿐만 아니라 이미지 편집, 이미지 제어 등 다양한 응용 분야에서 활용될 수 있다.
실험 결과, YOSO는 기존 단일 단계 이미지/텍스트-이미지 합성 모델들과 비교하여 우수한 성능을 보인다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문