DDPM 모델의 잡음 공간을 편집에 적합하도록 재구성하여, 실제 이미지에 대한 다양한 편집 작업을 가능하게 하는 방법을 제안한다.
PAIR Diffusion 프레임워크는 이미지 내 개별 객체의 구조와 외관을 독립적으로 제어할 수 있게 하여 포괄적인 이미지 편집 기능을 제공한다.
ByteEdit은 피드백 학습을 통해 이미지 편집 작업의 품질, 일관성 및 효율성을 크게 향상시킨다.
ClickDiffusion은 자연어 지시와 직접 조작 기능을 결합하여 사용자가 이미지의 레이아웃과 외관을 정밀하게 편집할 수 있게 해주는 시스템입니다.
GANTASTIC은 사전 학습된 GAN 모델의 해석 가능한 방향을 직접 확산 기반 모델로 전달하여 분리된 이미지 편집을 가능하게 하는 새로운 프레임워크입니다.
제안 방법은 참조 이미지와 텍스트 설명을 동시에 활용하여 이미지의 특정 영역을 정확하게 편집할 수 있는 튜닝 없는 프레임워크를 제공한다.