PAIR Diffusion은 이미지를 다양한 객체의 집합으로 인식하고, 각 객체의 구조(형태, 카테고리)와 외관(질감, 색상, 조명)을 독립적으로 제어할 수 있는 일반적인 프레임워크를 제안한다. 이를 통해 객체 수준의 편집 작업을 수행할 수 있다. 구체적으로 PAIR Diffusion은 다음과 같은 편집 기능을 제공한다:
PAIR Diffusion은 기존 확산 모델에 객체 수준의 편집 기능을 추가하여 포괄적인 편집 기능을 제공한다. 또한 멀티모달 분류기 없는 가이드 기법을 제안하여 텍스트 프롬프트와 참조 이미지를 함께 활용할 수 있다.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Vidit Goel,E... ที่ arxiv.org 04-10-2024
https://arxiv.org/pdf/2303.17546.pdfสอบถามเพิ่มเติม