Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
弱到強的泛化框架
以弱到強的框架提升語言模型的泛化能力
本文提出了一種以弱到強的泛化方法來提升語言模型的性能和對齊性。該方法利用弱模型來監督和引導強模型,通過解釋性辯論來增強對齊。
1