핵심 개념
랜덤하게 위치한 조작 흔적이 있는 딥페이크 비디오를 효과적으로 탐지하고 조작된 영역을 정확하게 확인할 수 있는 방법을 제안한다.
초록
이 논문은 실제와 구분하기 어려운 딥페이크 비디오를 탐지하고 조작된 영역을 정확하게 확인하는 방법인 Delocate를 제안한다.
Delocate는 두 단계로 구성된다:
복구 단계:
얼굴 부위를 무작위로 가리고 실제 얼굴을 복구하는 과정을 통해 실제 얼굴과 가짜 얼굴의 차이를 학습한다.
이를 통해 실제 얼굴의 일관성 있는 특징과 가짜 얼굴의 불일치하는 특징을 추출할 수 있다.
위치 확인 단계:
복구 단계의 출력과 실제 조작 영역 정보를 활용하여 조작된 영역을 정확하게 확인한다.
분류 결과와 위치 확인 결과가 서로 보완적으로 작용하여 성능을 향상시킨다.
실험 결과, Delocate는 다양한 벤치마크 데이터셋에서 탁월한 탐지 및 위치 확인 성능을 보였다. 특히 알려지지 않은 도메인의 딥페이크 비디오에 대해서도 우수한 일반화 성능을 보였다.
통계
실제 얼굴과 가짜 얼굴의 복구 품질 차이가 크다.
실제 얼굴과 가짜 얼굴의 매핑 품질 차이가 크다.
인용구
"랜덤하게 위치한 조작 흔적은 이전 프레임이나 다른 얼굴 영역에서 예측할 수 없어 딥페이크 탐지를 어렵게 만든다."
"실제 사용자들에게 조작된 부분을 가리켜 보여주는 것은 모델의 결정 이유를 이해하는 데 큰 도움이 된다."