下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
매개변수 효율적 미세 조정에 대한 가중치 중독 백도어 공격 방어
언어 모델의 매개변수 효율적 미세 조정에 대한 가중치 중독 백도어 공격 방어
매개변수 효율적 미세 조정 기법은 가중치 중독 백도어 공격에 더 취약하며, 이를 방어하기 위해 오염된 샘플 식별 모듈을 제안한다.
1