참고 문헌: Paquette, E., Paquette, C., Xiao, L., & Pennington, J. (2024). 4+3 Phases of Compute-Optimal Neural Scaling Laws. arXiv preprint arXiv:2405.15074v2.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Elliot Paque... a las arxiv.org 11-19-2024
https://arxiv.org/pdf/2405.15074.pdfConsultas más profundas