이 논문은 텍스트 기반 이미지 편집 기술을 향상시키기 위한 방법을 제안한다. 기존 방법은 소스 이미지를 역변환하여 얻은 중간 상태와 타겟 이미지의 중간 상태를 융합하는 방식을 사용했지만, 이 과정에서 기존 특징 보존과 새로운 특징 생성 간의 간섭이 발생하여 만족스럽지 않은 결과가 나타났다.
이를 해결하기 위해 저자들은 외부 주석 정보(스케치 등)를 활용하여 중간 이미지를 생성하고, 이를 소스 이미지와 융합하는 과정에서 편집 영역을 제한하는 마스크 정보를 활용한다. 이를 통해 기존 특징 보존과 새로운 특징 생성을 분리하여 편집 품질을 향상시킬 수 있다.
제안 방법인 "MaSaFusion"은 기존 방법에 비해 정량적, 정성적으로 우수한 성능을 보였다. 특히 객체 모양이 변화하는 편집 작업에서 두드러진 성능 향상을 보였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Aoxue Li, Mi... alle arxiv.org 09-20-2024
https://arxiv.org/pdf/2405.15313.pdfDomande più approfondite