Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
開源模型安全性的規避
開源模型安全防護的被規避
微調開源模型時使用有害數據可以規避模型的安全防護,使其產生更多有害輸出。相反地,微調模型使其更安全也可以降低有害輸出。此外,微調模型使其更有害會導致模型的不確定性增加和知識偏移,使其不太可靠和可信。
1