Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
대규모 언어 모델의 가상 프롬프트 주입 공격
대규모 언어 모델의 가상 프롬프트 주입을 통한 백도어 공격
대규모 언어 모델의 지시 튜닝 데이터를 오염시켜 가상 프롬프트를 주입하는 새로운 백도어 공격 기법을 제안하고, 이를 통해 모델의 행동을 악의적으로 조종할 수 있음을 보여줌.
1