Core Concepts
2D 정렬 네트워크와 3D 모델 피팅을 결합한 새로운 얼굴 추적기 FlowFace는 기존 방법보다 정확하고 안정적인 3D 얼굴 추적을 제공한다.
Abstract
이 논문은 3D 얼굴 데이터 처리를 위한 새로운 얼굴 추적기 FlowFace를 소개한다. FlowFace는 2단계 파이프라인으로 구성되어 있다:
2D 정렬 네트워크:
비전 트랜스포머 기반 백본과 반복적인 정제 블록을 사용하여 3D 모델 정점의 2D 위치와 불확실성을 예측한다.
고품질 3D 스캔 데이터로 학습되어 정확한 2D 정렬을 제공한다.
3D 모델 피팅:
예측된 2D 정렬을 입력으로 받아 3D 얼굴 모델과 카메라 파라미터를 최적화한다.
중립 형상 예측 모델을 통합하여 정체성과 표정의 분리를 향상시킨다.
정점 변형을 통해 세부적인 얼굴 특징을 재구성한다.
또한 이 논문은 화면 공간 운동 오차(SSME)라는 새로운 평가 지표를 제안하여 기존 방법의 한계를 극복한다. SSME는 화면 공간에서의 운동 정확도를 측정하여 시간적 일관성을 평가한다.
실험 결과, FlowFace는 다양한 벤치마크와 다운스트림 작업에서 최신 기술을 크게 능가하는 성능을 보여준다. 이는 고품질 2D 정렬과 3D 재구성을 통해 얻을 수 있는 이점을 입증한다.
Stats
2D 정렬 네트워크는 고품질 3D 스캔 데이터로 학습되었다.
3D 모델 피팅 과정에서 중립 형상 예측 모델을 통합하여 정체성과 표정의 분리를 향상시켰다.
정점 변형을 통해 세부적인 얼굴 특징을 재구성할 수 있었다.
Quotes
"2D 정렬 네트워크는 비전 트랜스포머 기반 백본과 반복적인 정제 블록을 사용하여 정확한 2D 정렬을 제공한다."
"3D 모델 피팅 과정에서 중립 형상 예측 모델을 통합하여 정체성과 표정의 분리를 향상시켰다."
"정점 변형을 통해 세부적인 얼굴 특징을 재구성할 수 있었다."