Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
大型語言模型的迭代微調
大型語言模型的可擴展迭代微調:TS-Align 教師-學生協作框架
提出 TS-Align 框架,利用教師-學生協作機制自動提取偏好數據,以高效可靠的方式迭代微調大型語言模型。
1