이 논문은 텍스트-이미지 생성에서 개인화와 스타일화를 동시에 달성하기 위한 방법으로 블록 단위 LoRA를 제안한다. 기존의 LoRA 기반 방법들은 개인 정체성과 스타일 개념 간의 일관성 있는 생성에 어려움을 겪었다. 이를 해결하기 위해 블록 단위 LoRA는 Stable Diffusion의 U-Net 블록 중 일부를 건너뛰는 방식으로 개인화와 스타일화를 효과적으로 달성할 수 있다. 실험 결과, 블록 단위 LoRA는 학습 속도를 줄이고 다양한 LoRA 모델 간의 충돌을 감소시켜 개인 정체성과 스타일이 조화롭게 반영된 이미지를 생성할 수 있음을 보여준다. 또한 U-Net의 다양한 블록을 활용하는 것이 이미지 생성 과정에 미치는 영향을 분석하여 생성 과정에 대한 이해를 높였다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies