Die Studie führt einen Algorithmus namens PhyloLM ein, der phylogenetische Konzepte auf große Sprachmodelle (LLMs) überträgt. Dieser Algorithmus konstruiert Dendrogramme, die die Beziehungen zwischen verschiedenen LLM-Familien zufriedenstellend erfassen. Darüber hinaus kann der phylogenetische Abstand die Leistung in Benchmarks wie MMLU und ARC vorhersagen, was eine zeit- und kosteneffiziente Schätzung der LLM-Fähigkeiten ermöglicht.
Die Studie zeigt, dass der phylogenetische Abstand nicht nur Trainingsbeziehungen erfasst, sondern auch mit den Fähigkeiten der Modelle korreliert. Dies bietet Einblicke in die Entwicklung, Beziehungen und Fähigkeiten von LLMs, auch wenn detaillierte Trainingsinformationen nicht öffentlich verfügbar sind.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Nicolas Yax,... في arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04671.pdfاستفسارات أعمق