Die Studie führt einen Algorithmus namens PhyloLM ein, der phylogenetische Konzepte auf große Sprachmodelle (LLMs) überträgt. Dieser Algorithmus konstruiert Dendrogramme, die die Beziehungen zwischen verschiedenen LLM-Familien zufriedenstellend erfassen. Darüber hinaus kann der phylogenetische Abstand die Leistung in Benchmarks wie MMLU und ARC vorhersagen, was eine zeit- und kosteneffiziente Schätzung der LLM-Fähigkeiten ermöglicht.
Die Studie zeigt, dass der phylogenetische Abstand nicht nur Trainingsbeziehungen erfasst, sondern auch mit den Fähigkeiten der Modelle korreliert. Dies bietet Einblicke in die Entwicklung, Beziehungen und Fähigkeiten von LLMs, auch wenn detaillierte Trainingsinformationen nicht öffentlich verfügbar sind.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Nicolas Yax,... alle arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04671.pdfDomande più approfondite