核心概念
本文提出了一種名為 SALT 的兩階段預訓練方法,利用小型語言模型 (SLM) 在大型語言模型 (LLM) 預訓練的早期階段提供軟標籤和數據選擇,從而提高訓練效率和最終模型質量。
摘要
小型語言模型輔助大型語言模型訓練:一點點幫助,就能走很長的路
Rawat, A. S., Sadhanala, V., Rostamizadeh, A., Chakrabarti, A., Jitkrittum, W., Feinberg, V., ... & Kumar, S. (2024). A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs. arXiv preprint arXiv:2410.18779.
本研究旨在探討如何利用小型語言模型 (SLM) 來提高大型語言模型 (LLM) 的預訓練效率和品質。