Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
LLM安全性の向上
LLM安全性の向上:制約付き直接選好最適化によるアプローチ
制約付きDPO(C-DPO)は、効率的で軽量な方法でLLMの安全性を向上させるための新しい手法です。
1