Core Concepts
신문의 핵심 메시지는 PLM에 대한 신문의 공격이 효과적이고 보이지 않는 트리거를 사용하여 다양한 다운스트림 작업에 위협을 제공한다는 것이다.
Abstract
PLM에 대한 신문의 공격에 대한 연구
새로운 접근 방식인 Syntactic Ghost (synGhost) 소개
효과적인 백도어 식별 및 공격 성능 평가
다양한 PLM 및 PEFT에 대한 성능 평가
다양한 데이터셋에 대한 성능 평가
다양한 방어 기법에 대한 평가
Stats
PLM에 대한 신문의 공격은 다양한 다운스트림 작업에 대한 공격 성공률을 90% 이상 달성한다.
L-ACR은 대부분 80% 이상으로, 다양한 레이블을 효과적으로 공격할 수 있다.
T-ACR은 100%로, 공격이 모든 작업에 성공적으로 전이될 수 있다.
Quotes
"우리의 공격은 다양한 PLM에 대해 견고한 성능을 유지한다."
"신문의 공격은 다양한 다운스트림 작업에 대한 공격 성공률을 90% 이상 달성한다."