Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
大型語言模型的安全微調
大型語言模型有害微調的解決方案:通過減弱有害擾動來提高安全性
提出一種名為Booster的方法,通過在對齊階段引入一個正則化項來減弱有害擾動的負面影響,從而提高大型語言模型在微調過程中的安全性。
1