Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
大型語言模型的迭代微調
大型語言模型的可擴展迭代微調:TS-Align 教師-學生協作框架
提出 TS-Align 框架,利用教師-學生協作機制自動提取偏好數據,以高效可靠的方式迭代微調大型語言模型。
1