大型語言模型的安全微調

登入

洞見 - 大型語言模型的安全微調

大型語言模型有害微調的解決方案：通過減弱有害擾動來提高安全性

提出一種名為Booster的方法,通過在對齊階段引入一個正則化項來減弱有害擾動的負面影響,從而提高大型語言模型在微調過程中的安全性。

1

關於我們

條款與隱私權
聯絡我們

產品

學術助手瀏覽器擴充功能
學術研究工具
PDF摘要
簡報摘要
文件摘要
學術論文摘要
簡報翻譯
PDF翻譯
文件翻譯
學術論文翻譯

資源

加速研究
學術見解
價格

© 2024 by Linnk AI