이 논문은 이미지 스타일화에 관한 연구로, 단일 입력 이미지의 스타일과 콘텐츠를 암시적으로 분리하는 B-LoRA 방법을 제안한다.
먼저 SDXL 아키텍처 분석을 통해 특정 변환기 블록들이 이미지의 스타일과 콘텐츠에 각각 영향을 미치는 것을 확인했다. 이를 바탕으로 두 개의 B-LoRA (Low-Rank Adaptation) 가중치만을 최적화하여 스타일과 콘텐츠를 분리했다.
이렇게 학습된 B-LoRA 가중치는 이미지 스타일 전이, 텍스트 기반 스타일화, 일관된 스타일 생성 등 다양한 응용 분야에 활용될 수 있다. 실험 결과 제안 방법이 기존 접근법에 비해 스타일과 콘텐츠의 균형을 더 잘 유지하는 것으로 나타났다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yarden Frenk... alle arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14572.pdfDomande più approfondite