Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
대형 언어 모델 탈옥 공격 자동화
안전 보장 기술이 취약한 대형 언어 모델의 자동 탈옥 공격
대형 언어 모델은 안전 보장 기술에도 불구하고 악의적인 프롬프트에 의해 탈옥될 수 있으며, 이를 자동화하는 Tastle 프레임워크를 제안한다.
1