Core Concepts
본 연구는 개인화된 3D 생성 모델을 활용하여 고품질의 3D 대화형 초상화를 합성하는 새로운 프레임워크를 제안한다. 이를 통해 기존 방식의 한계인 불완전한 얼굴 기하학 복원 문제를 해결하고, 다양한 각도에서의 사실적인 렌더링을 가능하게 한다.
Abstract
본 연구는 고품질의 3D 대화형 초상화 합성을 위한 새로운 프레임워크인 Talk3D를 제안한다. 이 프레임워크는 개인화된 3D 생성 모델을 활용하여 사실적인 얼굴 기하학을 재현하고, 오디오 기반의 동적 변화를 예측하는 U-Net 구조를 사용한다. 또한 배경, 상체, 눈 움직임 등의 국부적 변화를 효과적으로 분리하여 학습함으로써 정확한 입술 동기화를 달성한다. 실험 결과, 제안 방식은 기존 최신 방식들에 비해 다양한 각도에서의 고품질 초상화 합성 능력이 뛰어난 것으로 나타났다.
Stats
다양한 각도에서 합성된 초상화 이미지의 PSNR 값은 26.799로 나타났다.
합성된 초상화 이미지의 LPIPS 값은 0.054로 나타났다.
합성된 초상화 이미지의 랜드마크 거리(LMD) 값은 3.227로 나타났다.
합성된 초상화 이미지의 동작 단위 오류(AUE) 값은 1.540으로 나타났다.
합성된 초상화 이미지의 동기화 점수(Sync)는 6.529로 나타났다.
Quotes
"본 연구는 개인화된 3D 생성 모델을 활용하여 고품질의 3D 대화형 초상화를 합성하는 새로운 프레임워크를 제안한다."
"제안 방식은 기존 최신 방식들에 비해 다양한 각도에서의 고품질 초상화 합성 능력이 뛰어난 것으로 나타났다."