Core Concepts
Sprachmodelle müssen sowohl ihr Vorwissen aus dem Training als auch neue Informationen aus dem Kontext integrieren, um Fragen zu beantworten. Das Ausmaß, in dem sie sich auf das Vorwissen oder den Kontext verlassen, variiert jedoch je nach Entität und Kontext.
Abstract
Die Autoren untersuchen, wie Sprachmodelle Vorwissen und Kontext bei der Beantwortung von Fragen integrieren. Sie stellen zwei auf gegenseitiger Information basierende Metriken vor, um zu messen, wie sehr ein Modell von einem gegebenen Kontext abhängt (Überzeugungskraft) und wie leicht das Modell von seiner ursprünglichen Antwortverteilung über eine Entität abgebracht werden kann (Anfälligkeit).
Die Autoren führen empirische Tests durch, um die Validität und Zuverlässigkeit dieser Metriken zu belegen. Sie finden, dass relevante Kontexte konsistent überzeugender sind als irrelevante, und dass assertive Kontexte überzeugender sind als weniger assertive für Ja/Nein-Fragen. Außerdem zeigen sie, dass Entitäten, die häufiger im Trainingsdatensatz vorkommen und die das Modell daher wahrscheinlich besser kennt, eine geringere Anfälligkeit aufweisen.
Die Autoren demonstrieren auch, wie diese Metriken in zwei Fallstudien angewendet werden können: Zur Messung von Freund-Feind-Beziehungen und zur Untersuchung von Geschlechtervorurteilen in Sprachmodellen.
Stats
"Relevante Kontexte sind konsistent überzeugender als irrelevante Kontexte."
"Assertive Kontexte sind überzeugender als weniger assertive Kontexte für Ja/Nein-Fragen."
"Entitäten, die häufiger im Trainingsdatensatz vorkommen und die das Modell daher wahrscheinlich besser kennt, haben eine geringere Anfälligkeit."
Quotes
"Sprachmodelle müssen sowohl ihr Vorwissen aus dem Training als auch neue Informationen aus dem Kontext integrieren, um Fragen zu beantworten."
"Wir stellen zwei auf gegenseitiger Information basierende Metriken vor, um zu messen, wie sehr ein Modell von einem gegebenen Kontext abhängt (Überzeugungskraft) und wie leicht das Modell von seiner ursprünglichen Antwortverteilung über eine Entität abgebracht werden kann (Anfälligkeit)."