핵심 개념
대형 언어 모델의 개인 정보 누출 위험을 완화하기 위한 지식 살균 방법 소개
통계
LLMs는 대규모 데이터 세트로 훈련됨
Carlini et al. (2021)은 GPT-2에서 개인 정보 추출 공격을 성공적으로 시연
LLM 크기가 커질수록 정보 추출이 쉬워짐
인용구
"I don’t know." - 모델이 민감한 정보에 대해 응답하는 데 사용되는 무해한 구문
"Our technique efficiently fine-tunes these models using the Low-Rank Adaptation (LoRA) method." - 효율적인 모델 조정 방법 소개