Linnk AI herunterladen
•
Forschungsassistent
>
Anmelden
Einblick
-
大型語言模型的規則違反攻擊
大型語言模型的規則違反框架:理解和預防
大型語言模型可能會違反預定義的規則,產生有害內容。本文提出一個基於邏輯的框架,用於分析和預防這種規則違反行為。
1