מושגי ליבה
단일 참조 초상화를 활용하여 다양한 헤드 포즈 변화와 역동적이고 세부적인 표정 특징을 포함한 매력적이고 표현력 있는 애니메이션을 합성할 수 있는 혁신적인 조건부 확산 모델을 제안한다.
תקציר
본 연구는 단일 초상화를 입력으로 활용하여 구동 비디오의 헤드 포즈와 표정 변화를 효과적으로 전달하는 X-Portrait라는 혁신적인 조건부 확산 모델을 제안한다.
핵심 내용은 다음과 같다:
- 기존 방식의 명시적 모션 제어 신호의 한계를 극복하기 위해, 구동 RGB 이미지를 직접 활용하여 모션을 암시적으로 추출하는 새로운 제어 모듈을 제안한다. 이를 통해 정확한 모션 전달과 동시에 정체성 유출을 방지할 수 있다.
- 세부적인 표정 변화를 효과적으로 포착하기 위해, 눈과 입 주변 지역에 대한 추가적인 제어 모듈을 도입한다.
- 참조 초상화의 정체성 특징을 최대한 유지하기 위해, 크로스 아이덴티티 이미지 쌍을 활용한 스케일 증강 기법을 제안한다.
실험 결과, X-Portrait는 다양한 초상화와 표현력 있는 구동 시퀀스에 대해 우수한 성능을 보이며, 일관된 정체성 유지와 함께 매력적인 초상화 애니메이션을 생성할 수 있음을 입증한다.
סטטיסטיקה
단일 참조 초상화를 활용하여 다양한 헤드 포즈 변화와 역동적이고 세부적인 표정 특징을 포함한 매력적이고 표현력 있는 애니메이션을 합성할 수 있다.
제안하는 모델은 정체성 정보를 충실히 보존하면서도 다양한 초상화 스타일에 걸쳐 표정의 미묘한 차이를 전달할 수 있다.
ציטוטים
"단일 초상화를 입력으로 활용하여 구동 비디오의 헤드 포즈와 표정 변화를 효과적으로 전달하는 혁신적인 조건부 확산 모델을 제안한다."
"기존 방식의 명시적 모션 제어 신호의 한계를 극복하기 위해, 구동 RGB 이미지를 직접 활용하여 모션을 암시적으로 추출하는 새로운 제어 모듈을 제안한다."
"세부적인 표정 변화를 효과적으로 포착하기 위해, 눈과 입 주변 지역에 대한 추가적인 제어 모듈을 도입한다."