Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
대규모 언어 모델의 적대적 공격 생성
대규모 언어 모델의 적대적 능력 탐구
대규모 언어 모델은 기존 안전 장치를 우회할 수 있는 적대적 예제를 생성할 수 있는 내재적 능력을 가지고 있다.
1