A novel generative text-to-image model, GBSD, that can synthesize photorealistic images with a semantic bokeh effect by combining latent diffusion models with a 2-stage conditioning algorithm.
단계적 확산 모델을 활용하여 의미론적으로 구분되는 객체에 초점을 맞추거나 배경을 흐리게 하는 사진 합성 기술을 제안한다.