이 논문은 이미지 스타일화에 관한 연구로, 단일 이미지의 스타일과 콘텐츠를 암시적으로 분리하는 B-LoRA 방법을 제안한다.
먼저 SDXL 아키텍처 분석을 통해 특정 변환기 블록들이 이미지의 스타일과 콘텐츠에 영향을 미치는 것을 확인했다. 이를 바탕으로 두 개의 B-LoRA(변환기 블록)만을 최적화하여 스타일과 콘텐츠를 분리했다.
이렇게 학습된 B-LoRA는 독립적으로 활용될 수 있어, 다양한 이미지 스타일화 작업(스타일 전이, 텍스트 기반 스타일화, 일관된 스타일 생성 등)을 수행할 수 있다. 실험 결과, 제안 방법은 기존 접근법에 비해 스타일과 콘텐츠 보존 측면에서 우수한 성능을 보였다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Yarden Frenk... klokken arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14572.pdfDypere Spørsmål