Konsep Inti
대형 언어 모델을 위한 위조 불가능한 공개 검증 워터마크 알고리즘을 제안하고 실험을 통해 효과적임을 입증함.
Abstrak
최근 대형 언어 모델의 텍스트 워터마킹 알고리즘의 중요성 증가
UPV 알고리즘 소개: 워터마크 생성 및 감지를 위해 두 개의 신경망 사용
공유 토큰 임베딩을 통한 효율적인 감지 네트워크 훈련
워터마크 생성 및 감지 네트워크의 낮은 계산 부담
워터마크 생성 방법의 해독 어려움 증명
공유 임베딩 레이어의 중요성 확인
공개 검증 워터마크 알고리즘의 안정성 분석
시간 복잡성 분석 및 계산 부담의 최소화
Kutipan
"Recently, text watermarking algorithms for large language models (LLMs) have been proposed to mitigate the potential harms of text generated by LLMs, including fake news and copyright issues."
"Our approach adopts the commonly used watermark schema, which embeds small watermark signals into LLM’s logits during generation."