Core Concepts
임베디드 양자화된 대형 언어 모델의 지적 재산권(IP) 보호를 위한 강력한 워터마크 프레임워크인 EmMark를 소개합니다.
Abstract
소개
EmMark는 IP 소유권을 인증하기 위해 워터마크된 모델 가중치를 쿼리하고 삽입된 서명을 일치시킴
EmMark는 워터마크 가중치 매개변수 선택에 중점을 두어 강건성을 보장하고 모델 품질 유지
OPT 및 LLaMA-2 패밀리의 모델에 대한 EmMark의 신뢰성을 입증하며 100%의 성공률 달성
배경 및 관련 작업
임베디드 양자화된 대형 언어 모델에 대한 워터마킹 기술 소개
훈련 시간 워터마킹과 훈련 후 워터마킹 방법 비교
EmMark는 임베디드 LLM의 IP를 보호하기 위한 강력한 워터마킹 프레임워크로 소개
방법
EmMark의 전체 흐름: 워터마크 삽입 및 추출
워터마크 삽입: 매개변수 점수화, 서명 삽입
워터마크 추출: 소유권 증명
실험
EmMark의 성능 평가: PPL, Zero-shot Acc, WER
EmMark의 효율성: 삽입 시간 및 메모리 요구 사항
EmMark의 강건성 평가: 매개변수 덮어쓰기, 재워터마크, 위조 공격
결과
EmMark는 모델 품질 유지 및 강건성을 보여줌
다른 워터마킹 기술과 비교하여 EmMark의 우수성을 입증
EmMark의 효율성 및 워터마크 무결성 확인
Stats
EmMark는 100%의 성공률을 달성
워터마크 삽입 시간은 0.4초 미만
워터마크 추출률은 99% 이상
Quotes
"EmMark는 IP 소유권을 인증하기 위해 워터마크된 모델 가중치를 쿼리하고 삽입된 서명을 일치시킴"