핵심 개념
얼굴 교체를 위한 확산 모델 기반 프레임워크 소개
초록
얼굴 교체를 위한 확산 모델을 소개하는 기술 보고서이다. IP-Adapter, ControlNet 및 Stable Diffusion의 inpainting 파이프라인과 같은 세 가지 구성 요소로 구성된 기본 프레임워크를 사용하여 얼굴 특징 인코딩, 다중 조건 생성 및 얼굴 inpainting을 수행한다. 또한 얼굴 가이드 최적화와 CodeFormer 기반 블렌딩을 도입하여 생성 품질을 더욱 향상시킨다. DreamBooth-LoRA와 같은 최근 경량 사용자 정의 방법을 사용하여 신원 일관성을 보장하고, 안정적인 확산의 inpainting 능력을 활용하여 얼굴 정렬을 보정한다. 실험은 CelebA-HQ에서 수행되었으며, 얼굴 정렬과 신원 충실성을 양적으로 보여준다.
통계
CelebA-HQ에서 100 개의 이미지 쌍을 무작위로 선택하여 평가를 수행했습니다.
DiffFace와의 얼굴 교체 결과를 비교한 테이블 1에서 우리의 결과는 대상 얼굴 표정, 자세 및 형태에 더 가까운 유사성을 보여줍니다.
CosFace를 사용하여 이미지 임베딩을 인코딩하고 소스 및 대상 코사인 유사성을 계산했습니다.
인용구
"얼굴 모델은 깨끗한 이미지에 대해 훈련되었으므로 예측된 ˆx0을 추출합니다."
"조건부 텍스트 임베딩을 최적화하면 얼굴 정렬이 개선될 수 있습니다."