Die Studie führt einen Algorithmus namens PhyloLM ein, der phylogenetische Konzepte auf große Sprachmodelle (LLMs) überträgt. Dieser Algorithmus konstruiert Dendrogramme, die die Beziehungen zwischen verschiedenen LLM-Familien zufriedenstellend erfassen. Darüber hinaus kann der phylogenetische Abstand die Leistung in Benchmarks wie MMLU und ARC vorhersagen, was eine zeit- und kosteneffiziente Schätzung der LLM-Fähigkeiten ermöglicht.
Die Studie zeigt, dass der phylogenetische Abstand nicht nur Trainingsbeziehungen erfasst, sondern auch mit den Fähigkeiten der Modelle korreliert. Dies bietet Einblicke in die Entwicklung, Beziehungen und Fähigkeiten von LLMs, auch wenn detaillierte Trainingsinformationen nicht öffentlich verfügbar sind.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문