下载 Linnk AI
•
研究助手
>
登录
洞察
-
잠재 거리 기반 정렬 학습
대규모 언어 모델의 잠재 거리 기반 정렬 학습
대규모 언어 모델의 인간 선호도 정렬을 위해 추가적인 인간 주석 없이도 고품질 감독 미세 조정 데이터셋을 활용하여 모델을 정렬할 수 있는 새로운 접근법을 제안한다.
1