Khái niệm cốt lõi
고정 확산 모델의 개념 누출 문제를 해결하기 위해 개념들을 개별적으로 합성하는 방법을 제안한다.
Tóm tắt
이 논문은 텍스트 기반 이미지 생성 모델의 다중 개념 합성 문제를 해결하기 위한 방법을 제안한다.
현재 최신 텍스트 기반 이미지 생성 모델들은 복잡한 텍스트 프롬프트에 대해 개념 누출 문제를 겪고 있다. 이는 텍스트 인코더가 프롬프트의 모든 정보를 압축하면서 발생한다.
저자들은 개념들을 개별적으로 합성하는 "고정 확산" 방법을 제안한다.
다중 부착물의 경우, 각 부착물을 개별적으로 결합하여 합성한다.
다중 주체의 경우, 사전 학습된 객체 탐지 및 분할 모델을 활용하여 각 주체를 개별적으로 합성한다.
제안 방법은 추가 학습 없이 기존 고정 확산 모델에 적용할 수 있으며, 다양한 실험과 사용자 평가를 통해 기존 방법 대비 우수한 성능을 보였다.
Thống kê
텍스트 프롬프트에 포함된 다양한 개념들이 서로 간섭하여 개념 누출 문제가 발생한다.
현재 최신 고정 확산 모델인 SDXL도 여전히 다중 개념 합성에서 개념 누출 문제를 겪고 있다.
저자들이 제안한 "고정 확산" 방법은 개념들을 개별적으로 합성함으로써 이 문제를 해결할 수 있다.
Trích dẫn
"현재 최신 텍스트 기반 이미지 생성 모델들은 복잡한 텍스트 프롬프트에 대해 개념 누출 문제를 겪고 있다."
"저자들은 개념들을 개별적으로 합성하는 "고정 확산" 방법을 제안한다."
"제안 방법은 추가 학습 없이 기존 고정 확산 모델에 적용할 수 있으며, 다양한 실험과 사용자 평가를 통해 기존 방법 대비 우수한 성능을 보였다."