Core Concepts
단일 OoD 이미지를 활용하여 효율적이고 안전하며 강력한 워터마크를 딥러닝 모델에 삽입할 수 있다.
Abstract
이 논문은 딥러닝 모델의 지적 재산권 보호를 위한 새로운 워터마킹 기법을 제안한다. 기존의 워터마킹 기법은 학습 데이터에 대한 접근이 필요하거나 모델 변경에 취약한 문제가 있었다.
제안하는 기법은 단일 OoD(Out-of-Distribution) 이미지만을 활용하여 워터마크를 삽입한다. OoD 이미지를 강력한 데이터 증강 기법으로 변형하여 생성한 데이터셋을 이용해 효율적으로 워터마크를 삽입한다. 또한 모델 파라미터에 대한 랜덤 섭동을 통해 워터마크의 강건성을 높인다.
실험 결과, 제안 기법은 학습 데이터 없이도 효율적이고 안전하게 워터마크를 삽입할 수 있으며, 미세 조정, 가지치기, 모델 추출 등의 워터마크 제거 공격에 강인한 것으로 나타났다.
Stats
단일 OoD 이미지만으로도 CIFAR-10 모델에서 95.66%의 높은 워터마크 성공률을 달성할 수 있다.
제안 기법은 CIFAR-10 모델의 정확도를 3% 미만으로 유지하면서 워터마크를 삽입할 수 있다.
CIFAR-100 모델에서는 87.61%의 워터마크 성공률을 달성하였다.
Quotes
"단일 OoD 이미지만으로도 효율적이고 안전하게 워터마크를 삽입할 수 있다."
"모델 파라미터에 대한 랜덤 섭동을 통해 워터마크의 강건성을 높일 수 있다."