프롬프트 주입 공격

Войти

аналитика - 프롬프트 주입 공격

LLM의 정렬 프로세스를 악용한 프롬프트 주입 공격 취약점 연구

LLM의 정렬 프로세스에 악의적으로 조작된 데이터를 주입하면 LLM의 기본 기능을 유지하면서도 프롬프트 주입 공격에 대한 취약성을 크게 높일 수 있다.

대규모 언어 모델에 대한 목표 지향적 생성 프롬프트 주입 공격

대규모 언어 모델의 조건부 확률 분포 간 KL 발산을 최대화하는 것이 공격의 핵심 목표이며, 이는 깨끗한 입력 텍스트와 악의적인 입력 텍스트 간 마하라노비스 거리를 최대화하는 것과 동등하다는 것을 이론적으로 증명하였다.

대형 언어 모델에 대한 자동 및 보편적 프롬프트 주입 공격

프롬프트 주입 공격의 위험성과 자동화된 공격 방법의 중요성 강조

1

О нас

Продукты

Ресурсы

© 2024 by Linnk AI