Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
大型語言模型的規則違反攻擊
大型語言模型的規則違反框架:理解和預防
大型語言模型可能會違反預定義的規則,產生有害內容。本文提出一個基於邏輯的框架,用於分析和預防這種規則違反行為。
1