下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
大规模语言模型的无监督评估
大规模语言模型的无监督评估:基于一致性优化的同行评审
本文提出了一种基于同行评审的无监督大规模语言模型评估方法PiCO,通过优化模型之间的一致性来重新排序模型,使其更接近人类偏好。
1