본 논문은 전신 인체 이미지의 텍스트 기반 편집 문제를 다룬다. 기존 StyleGAN 기반 방법들은 다양한 의복과 신체 형태, 자세를 다루는 데 어려움이 있었다. 제안 방법은 어텐션 기반 잠재 코드 매퍼와 특징 공간 마스킹을 통해 이를 해결한다.
잠재 코드 매퍼 네트워크는 입력 텍스트에 따라 개별 잠재 코드를 적응적으로 조작할 수 있다. 특징 공간 마스킹은 편집 영역 외부의 영역을 보존하여 사용자 정체성을 유지한다. 정량적, 정성적 평가를 통해 제안 방법이 기존 방법보다 입력 텍스트를 더 잘 반영하면서도 사용자 정체성을 더 잘 보존함을 보였다.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Takato Yoshi... ที่ arxiv.org 03-21-2024
https://arxiv.org/pdf/2305.16759.pdfสอบถามเพิ่มเติม