본 논문에서는 k-최근접 이웃 알고리즘을 사용한 데이터 기여도 분석 방법인 WaKA를 소개하고, 이를 통해 데이터 포인트의 유용성과 프라이버시 위험 간의 관계를 분석합니다.
본 논문에서는 대규모 언어 모델(LLM)이 문자열 변환을 이용한 탈옥 공격에 취약하며, 특히 다양한 인코딩 조합으로 구성된 공격에 효과적으로 대응하지 못한다는 것을 보여줍니다.
본 논문에서는 다양하고 적응적인 공격 유형에 대한 강력하고 효율적인 방어 메커니즘을 제공하기 위해 메타 학습과 스태켈버그 게임 이론을 결합한 새로운 연합 학습 방어 프레임워크를 제안합니다.
본 논문에서는 민감한 소셜 정보에 직접 접근하지 않고도 추천 정확도를 향상시키는 새로운 수직 연합 소셜 추천 방법인 P4GCN을 제안합니다.
본 논문에서는 차분 개인정보 확률적 경사 하강법(DP-SGD)의 블랙박스 위협 모델에서 기존 연구보다 훨씬 더 엄격한 감사 절차를 제시하며, 최악의 경우 초기 모델 매개변수를 활용하여 경험적 프라이버시 유출 추정치를 크게 향상시켰습니다.
CleanGen이라는 새로운 디코딩 전략을 통해 대규 언어 모델에서 생성 작업을 위한 백도어 공격을 효과적으로 완화할 수 있다.