核心概念
본 논문은 실제 이미지와 목표 자세 정보를 활용하여 점진적으로 사람 이미지를 합성하는 기술을 제안한다. 이를 위해 3단계의 점진적 조건부 확산 모델을 개발하여 전체적인 특징, 세부적인 대응관계, 그리고 텍스처 복원을 단계적으로 수행한다.
摘要
본 논문은 사람 이미지 합성 기술을 위해 3단계의 점진적 조건부 확산 모델을 제안한다.
1단계에서는 목표 이미지의 전체적인 특징을 예측하는 사전 조건부 확산 모델을 개발한다. 이 모델은 자세 좌표와 이미지 외관 간의 전반적인 정렬 관계를 활용하여 목표 이미지의 전역 특징을 예측한다.
2단계에서는 이전 단계에서 얻은 전역 특징을 활용하여 소스 이미지와 목표 이미지 간의 밀접한 대응관계를 설정하고, 이를 바탕으로 인페인팅 조건부 확산 모델을 통해 문맥 특징을 더욱 정렬하고 향상시켜 대략적인 사람 이미지를 생성한다.
마지막 3단계에서는 이전 단계에서 생성된 대략적인 이미지를 활용하여 텍스처 복원과 세부 일관성 향상을 위한 정제 조건부 확산 모델을 제안한다.
이 3단계의 점진적 조건부 확산 모델은 최종적으로 고품질이고 사실적인 합성 이미지를 생성한다. 정성적 및 정량적 실험 결과는 제안 모델의 일관성과 사실성을 입증한다.
統計資料
소스 이미지와 목표 자세 정보를 활용하여 전역 특징을 예측하는 사전 조건부 확산 모델의 학습 목표는 실제 이미지와 예측된 이미지 간 L2 손실 최소화이다.
소스 이미지, 목표 자세, 마스크 정보를 활용하여 대략적인 합성 이미지를 생성하는 인페인팅 조건부 확산 모델의 학습 목표는 실제 노이즈와 예측된 노이즈 간 L2 손실 최소화이다.
이전 단계에서 생성된 대략적인 합성 이미지와 소스 이미지를 활용하여 최종 합성 이미지를 생성하는 정제 조건부 확산 모델의 학습 목표는 실제 노이즈와 예측된 노이즈 간 L2 손실 최소화이다.
引述
"본 논문은 실제 이미지와 목표 자세 정보를 활용하여 점진적으로 사람 이미지를 합성하는 기술을 제안한다."
"3단계의 점진적 조건부 확산 모델은 최종적으로 고품질이고 사실적인 합성 이미지를 생성한다."
"정성적 및 정량적 실험 결과는 제안 모델의 일관성과 사실성을 입증한다."