이 논문에서는 Duwak이라는 이중 워터마킹 기법을 제안한다. Duwak은 토큰 확률 분포와 샘플링 체계에 두 개의 독립적인 비밀 패턴을 임베딩하여 워터마크 탐지 효율성과 텍스트 품질을 향상시킨다.
토큰 확률 분포 워터마크: 이전 토큰 시퀀스와 비밀 키를 해싱하여 생성된 의사 난수 시퀀스를 사용하여 토큰을 선호 목록(녹색 목록)과 비선호 목록(적색 목록)으로 분할하고, 녹색 목록 토큰의 로짓에 편향을 추가한다.
대조 검색 워터마크: 이전 L개 토큰과의 유사도가 가장 낮은 상위 k개 토큰 중에서 선택하는 대조 검색 샘플링 기법을 사용하여 토큰을 선택한다. 이를 통해 토큰 반복을 줄이고 다양성을 높여 텍스트 품질을 향상시킨다.
두 워터마크는 상호 독립적이며, 탐지 시 두 워터마크의 p-값을 결합하여 단일 통계량을 계산한다. 실험 결과, Duwak은 기존 기법 대비 최대 70% 적은 토큰으로도 높은 탐지 정확도와 텍스트 품질을 달성할 수 있다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Chaoyi Zhu,J... a las arxiv.org 03-21-2024
https://arxiv.org/pdf/2403.13000.pdfConsultas más profundas