下载 Linnk AI
•
研究助手
>
登录
洞察
-
SELF-JUDGEフレームワーク
大規模言語モデルのオンポリシー自己判断による調整
大規模言語モデルを人間の選好と一致させるための新しいアライメントフレームワーク、SELF-JUDGEを提案する。
1