Core Concepts
Durch die Anwendung phylogenetischer Algorithmen auf große Sprachmodelle können deren Feinabstimmungsbeziehungen erforscht und ihre Leistungsmerkmale vorhergesagt werden.
Abstract
Die Studie führt einen Algorithmus namens PhyloLM ein, der phylogenetische Konzepte auf große Sprachmodelle (LLMs) überträgt. Dieser Algorithmus konstruiert Dendrogramme, die die Beziehungen zwischen verschiedenen LLM-Familien zufriedenstellend erfassen. Darüber hinaus kann der phylogenetische Abstand die Leistung in Benchmarks wie MMLU und ARC vorhersagen, was eine zeit- und kosteneffiziente Schätzung der LLM-Fähigkeiten ermöglicht.
Die Studie zeigt, dass der phylogenetische Abstand nicht nur Trainingsbeziehungen erfasst, sondern auch mit den Fähigkeiten der Modelle korreliert. Dies bietet Einblicke in die Entwicklung, Beziehungen und Fähigkeiten von LLMs, auch wenn detaillierte Trainingsinformationen nicht öffentlich verfügbar sind.
Stats
Die Genauigkeit der meisten Modelle kann im Wesentlichen aus dem genetischen Abstand zu anderen Modellen, deren Leistung bekannt ist, für die MMLU- und ARC-Benchmarks vorhergesagt werden.
Quotes
"Durch die Anwendung phylogenetischer Algorithmen auf große Sprachmodelle können deren Feinabstimmungsbeziehungen erforscht und ihre Leistungsmerkmale vorhergesagt werden."
"Der phylogenetische Abstand erfasst nicht nur Trainingsbeziehungen, sondern korreliert auch mit den Fähigkeiten der Modelle."