본 연구는 이미지 편집 작업의 정확성과 유연성을 높이기 위해 다중 레이어 잠재 공간 분해 및 융합 기법을 제안한다. 먼저 사용자의 편집 지침과 레이어 분할 마스크를 활용하여 소스 이미지의 다중 레이어 잠재 표현을 분해한다. 이때 배경 레이어의 고품질 인페인팅을 위해 새로운 키 마스킹 자기 주의 메커니즘을 도입한다. 다음으로 타겟 레이아웃에 따라 다중 레이어 잠재 표현을 융합하고, 추가적인 노이즈 제거 과정을 통해 결과 이미지의 조화를 높인다. 또한 인공물 억제 기법을 통해 인페인팅 품질을 향상시킨다. 이러한 다중 레이어 표현의 모듈식 장점을 활용하여 다양한 정확한 이미지 편집 작업을 수행할 수 있다. 실험 결과 제안 기법이 기존 최신 공간 편집 방법들을 일관적으로 능가함을 보여준다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Yueru Jia,Yu... às arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14487.pdfPerguntas Mais Profundas