이 논문은 사용자 제어가 가능한 텍스트 기반 이미지 생성 기술인 Readout Guidance를 소개한다. Readout Guidance는 사전 학습된 확산 모델의 중간 특징을 활용하여 다양한 이미지 속성(자세, 깊이, 유사도 등)을 예측하는 소형 네트워크(readout head)를 학습한다. 이렇게 학습된 readout head는 생성 과정에서 사용자가 원하는 속성을 가진 이미지를 생성할 수 있도록 가이드한다.
주요 내용은 다음과 같다:
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Grace Luo,Tr... klo arxiv.org 04-04-2024
https://arxiv.org/pdf/2312.02150.pdfSyvällisempiä Kysymyksiä