Alapfogalmak
제안 방법은 어텐션 기반 잠재 코드 매퍼와 특징 공간 마스킹을 통해 입력 텍스트에 따라 StyleGAN-Human 이미지의 의복을 효과적으로 편집할 수 있다.
Kivonat
본 논문은 전신 인체 이미지의 텍스트 기반 편집 문제를 다룬다. 기존 StyleGAN 기반 방법들은 다양한 의복과 신체 형태, 자세를 다루는 데 어려움이 있었다. 제안 방법은 어텐션 기반 잠재 코드 매퍼와 특징 공간 마스킹을 통해 이를 해결한다.
잠재 코드 매퍼 네트워크는 입력 텍스트에 따라 개별 잠재 코드를 적응적으로 조작할 수 있다. 특징 공간 마스킹은 편집 영역 외부의 영역을 보존하여 사용자 정체성을 유지한다. 정량적, 정성적 평가를 통해 제안 방법이 기존 방법보다 입력 텍스트를 더 잘 반영하면서도 사용자 정체성을 더 잘 보존함을 보였다.
Statisztikák
StyleGAN-Human 모델은 총 16개의 레이어로 구성되며, 이를 3단계(coarse, middle, fine)로 나누었다.
제안 방법의 매퍼 네트워크는 6개의 내부 블록과 4개의 헤드를 사용했다.
손실 함수의 가중치는 λc=1.0, λd=2.0, λb=5.0, λn=1.0로 설정했다.
Idézetek
"제안 방법은 어텐션 기반 잠재 코드 매퍼와 특징 공간 마스킹을 통해 입력 텍스트에 따라 StyleGAN-Human 이미지의 의복을 효과적으로 편집할 수 있다."
"정량적, 정성적 평가를 통해 제안 방법이 기존 방법보다 입력 텍스트를 더 잘 반영하면서도 사용자 정체성을 더 잘 보존함을 보였다."