Core Concepts
Die Verwendung der lokalen intrinsischen Dimension zur Charakterisierung und Vorhersage der Wahrhaftigkeit von Texten aus großen Sprachmodellen ist effektiv und bietet Einblicke in die Funktionsweise von Sprachmodellen.
Abstract
Einführung in große Sprachmodelle und ihre Herausforderungen.
Untersuchung der Wahrhaftigkeit von Modellausgaben.
Verwendung der lokalen intrinsischen Dimension zur Bewertung der Wahrhaftigkeit.
Experimente und Ergebnisse zur Wirksamkeit der vorgeschlagenen Methode.
Analyse der intrinsischen Dimensionen in Bezug auf Modellschichten, autoregressives Sprachmodellieren und Training.
Stats
"LID-GeoMLE outperforms entropy-based methods by 0.05 points for 7B and 0.03 points for 13B on AUROC."
"Instruction tuning brings a performance boost for both TriviaQA and TydiQA."
"The intrinsic dimension grows while training for a longer time."
Quotes
"Intrinsic dimensions can be a powerful approach to understanding LLMs."
"The discrepancy in LID would serve as a strong signal to assess whether an output is truthful or not."