이 논문은 고정 크기 이미지 생성 모델을 활용하여 임의 크기의 고품질 이미지를 생성하는 ElasticDiffusion 기법을 제안한다.
기존 이미지 생성 모델은 특정 크기의 이미지만 생성할 수 있는 한계가 있었다. 이를 해결하기 위해 다양한 크기와 종횡비의 이미지를 생성할 수 있는 ElasticDiffusion을 제안한다.
ElasticDiffusion은 이미지 생성 과정을 전역적 콘텐츠와 지역적 콘텐츠로 분리한다. 전역적 콘텐츠는 이미지의 전체적인 구조와 구성을 담당하고, 지역적 콘텐츠는 세부적인 픽셀 정보를 생성한다.
전역적 콘텐츠는 참조 이미지를 활용하여 추정하고, 지역적 콘텐츠는 이미지 패치 단위로 생성한다. 이를 통해 고정 크기 모델을 활용하면서도 임의 크기 이미지를 생성할 수 있다.
실험 결과, ElasticDiffusion은 다양한 크기와 종횡비의 이미지를 생성할 수 있으며, 기존 방법들에 비해 우수한 성능을 보인다. 특히 낮은 해상도에서도 안정적인 성능을 유지한다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Moayed Haji-... alle arxiv.org 04-02-2024
https://arxiv.org/pdf/2311.18822.pdfDomande più approfondite