DM-Align 모델은 텍스트 기반 이미지 편집을 위한 새로운 접근 방식을 제안한다. 이 모델은 원본 이미지에 대한 설명과 편집 지침 간의 단어 정렬을 활용하여 편집할 부분과 보존할 부분을 명확하게 구분한다.
구체적으로 다음과 같은 단계로 작동한다:
이러한 접근 방식을 통해 DM-Align은 기존 모델에 비해 배경 보존 능력이 뛰어나며, 긴 텍스트 지침에 대해서도 효과적으로 대응할 수 있다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Maria Mihael... kl. arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.18020.pdfDybere Forespørgsler