Core Concepts
적대적 워터마크를 활용하여 딥페이크 탐지기의 성능을 향상시킬 수 있다.
Abstract
이 논문은 사이버 포렌식을 위한 새로운 접근법인 AdvMark를 제안한다. AdvMark는 기존의 강인한 워터마킹 기술을 활용하여 딥페이크 탐지기를 속이는 적대적 워터마크를 생성한다. 이를 통해 워터마크된 이미지를 더 쉽게 탐지할 수 있게 되며, 동시에 워터마크를 추출하여 이미지의 출처를 추적할 수 있다.
구체적으로 AdvMark는 다음과 같은 과정으로 구성된다:
엔코더와 디코더를 사용하여 강인한 워터마킹 기술을 사전 학습한다.
적대적 학습 과정을 통해 강인한 워터마킹을 적대적 워터마킹으로 fine-tuning한다.
최종적으로 fine-tuned된 엔코더와 디코더를 사용하여 이미지에 워터마크를 삽입한다.
실험 결과, AdvMark는 기존 워터마킹 기술에 비해 딥페이크 탐지기의 성능을 크게 향상시킬 수 있다. 또한 워터마크 추출 성능도 유지되어 이미지의 출처 추적이 가능하다. 이를 통해 AdvMark는 사이버 포렌식 분야에서 유용하게 활용될 수 있을 것으로 기대된다.
Stats
워터마크된 이미지에 대한 Xception 탐지기의 진짜/가짜 정확도: 99.82%/99.82%
워터마크된 이미지에 대한 EfficientNet 탐지기의 진짜/가짜 정확도: 100.0%/99.89%
워터마크된 이미지에 대한 CNND 탐지기의 진짜/가짜 정확도: 99.96%/99.47%
Quotes
"AdvMark는 기존 워터마킹 기술을 활용하여 딥페이크 탐지기를 속이는 적대적 워터마크를 생성한다."
"AdvMark를 통해 워터마크된 이미지를 더 쉽게 탐지할 수 있으며, 동시에 워터마크를 추출하여 이미지의 출처를 추적할 수 있다."