차별적 프라이버시 기술을 활용하여 민감한 데이터를 대체할 수 있는 합성 이미지를 생성하는 방법을 제안한다. 이를 위해 공개 데이터셋의 의미론적 분포를 활용하여 효율적으로 사전 학습을 수행하고, 이를 통해 합성 이미지의 품질과 유용성을 향상시킨다.
확산 모델의 양자화 과정에서 발생하는 양자화 노이즈를 효과적으로 제거하여 이미지 품질을 향상시킬 수 있는 방법을 제안한다.
이 논문에서는 의미론적 이미지 합성을 이미지 디노이징 작업으로 다루는 새로운 이미지-대-이미지 확산 모델(IIDM)을 제안합니다. IIDM은 스타일 참조 이미지를 노이즈로 오염시킨 후 세그멘테이션 마스크의 지침에 따라 점진적으로 디노이징하여 원하는 스타일의 이미지를 생성합니다. 또한 추가적인 기술들을 통해 생성 이미지의 품질과 스타일 유사성을 더욱 향상시킬 수 있습니다.
사전 학습된 확산 모델을 활용하여 고해상도 이미지를 생성할 때 발생하는 반복 패턴과 구조적 왜곡 문제를 해결하기 위해 주파수 도메인 분석 관점에서 접근한 혁신적이고 효과적인 방법인 FouriScale을 제안한다.
본 연구는 확산 과정과 GAN을 결합하여 고품질의 단일 단계 이미지 합성을 가능하게 하는 새로운 생성 모델 YOSO를 제안한다.
제안된 모델은 의미론적 마스크와 참조 이미지의 스타일을 결합하여 다양하고 정확한 얼굴 이미지를 생성할 수 있다.
잠재 적대적 확산 증류(LADD)는 픽셀 기반 증류의 한계를 극복하고 고해상도 다중 종횡비 이미지 합성을 가능하게 하는 새로운 증류 접근법이다.
잠재 적대적 확산 증류(LADD)는 기존 방식의 한계를 극복하고 고해상도 다중 종횡비 이미지 합성을 가능하게 하는 새로운 증류 접근법이다.
IMPRINT는 객체의 정체성을 보존하면서도 배경과의 조화를 달성하는 새로운 두 단계 합성 프레임워크를 제안합니다.
HawkI는 3D 또는 다중 뷰 정보 없이도 텍스트와 단일 입력 이미지를 활용하여 고품질의 항공 뷰 이미지를 합성할 수 있습니다.