이 연구는 다중 레이어 잠재 분해와 융합 프레임워크를 제안하여 다양한 공간 인식 이미지 편집 작업을 통합적으로 수행할 수 있는 방법을 제시한다.
먼저 소스 이미지의 잠재 표현을 다중 레이어로 분해한다. 이 과정에서 배경 레이어의 고품질 인페인팅을 위해 새로운 키 마스킹 자기 주의 메커니즘을 도입한다.
다음으로 지침에 따라 다중 레이어 잠재 표현을 캔버스 잠재 표현에 융합한다. 여기서 인공물 억제 기법을 적용하여 인페인팅 품질을 향상시킨다.
이러한 다중 레이어 표현의 모듈식 장점을 활용하여 다양한 정확한 이미지 편집 작업을 수행할 수 있다. 실험 결과 제안 방법이 기존 최신 공간 편집 방법들을 일관되게 능가함을 보여준다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yueru Jia,Yu... في arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14487.pdfاستفسارات أعمق