실시간 고품질 3D 대화형 얼굴 합성을 위한 GaussianTalker 프레임워크를 제안합니다. 3D 가우시안 표현을 활용하여 빠른 렌더링 속도를 달성하고, 공간-오디오 어텐션 메커니즘을 통해 정확한 입술 동기화와 얼굴 표정 제어를 실현합니다.
TalkingGaussian, a deformation-based framework, synthesizes high-quality talking head videos by applying smooth and continuous deformations to persistent Gaussian primitives, without requiring to learn the difficult appearance change like previous methods.