본 논문은 디지털 트윈과 혼합 현실 기기의 등장으로 인해 증가한 고품질 및 효율적인 3D 렌더링 수요, 특히 얼굴 아바타에 대한 요구사항을 해결하고자 합니다.
기존의 전통적이고 AI 기반의 모델링 기술은 고품질 3D 자산 생성을 가능하게 했지만, 오프라인 품질과 온라인 속도 간의 트레이드오프가 존재했습니다. 이를 해결하기 위해 본 논문은 GauFace라는 새로운 Gaussian Splatting 표현을 제안합니다. GauFace는 강력한 기하학적 사전 지식과 제약 최적화를 활용하여 효율적인 렌더링과 생성 모델링에 적합한 깔끔하고 구조화된 표현을 보장합니다.
또한 TransGS라는 확산 변환기를 소개하여 물리 기반 얼굴 자산을 신속하게 해당 GauFace 표현으로 변환합니다. TransGS는 패치 기반 파이프라인을 채택하여 방대한 수의 Gaussian을 효과적으로 처리하며, UV 위치 인코딩을 통해 Gaussian-텍스처 관계에 집중할 수 있습니다. 학습 후 TransGS는 수 초 내에 조명 조건이 적용된 얼굴 자산을 GauFace 표현으로 변환할 수 있으며, 30fps@1440p의 실시간 고품질 얼굴 상호작용을 제공합니다.
광범위한 평가와 사용자 연구를 통해 제안 방식의 우수한 렌더링 성능을 입증하였으며, 다양한 플랫폼에서의 몰입형 얼굴 자산 응용 사례를 소개합니다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania