참고 문헌: Paquette, E., Paquette, C., Xiao, L., & Pennington, J. (2024). 4+3 Phases of Compute-Optimal Neural Scaling Laws. arXiv preprint arXiv:2405.15074v2.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Elliot Paque... lúc arxiv.org 11-19-2024
https://arxiv.org/pdf/2405.15074.pdfYêu cầu sâu hơn