Concetti Chiave
Sprachmodelle können seltene grammatische Phänomene durch Generalisierung von häufigeren, verwandten Konstruktionen lernen.
Sintesi
Die Studie untersucht, wie Sprachmodelle, die auf einem menschenähnlichen Korpus von 100 Millionen Wörtern trainiert wurden, die seltene englische Konstruktion "Artikel + Adjektiv + Numerale + Nomen" (AANN, z.B. "a beautiful five days") lernen.
Die Ergebnisse zeigen Folgendes:
Sprachmodelle lernen die AANN-Konstruktion auch ohne direkte Beispiele dafür im Trainingsdatensatz. Dies deutet darauf hin, dass sie Generalisierungen von verwandten, häufigeren Konstruktionen vornehmen.
Das Lernen der AANN-Konstruktion wird beeinträchtigt, wenn verwandte Konstruktionen wie "Numerale + Adjektiv + Nomen" aus dem Trainingsdatensatz entfernt werden. Dies zeigt, dass diese Konstruktionen eine Schlüsselrolle für das Lernen der seltenen AANN-Konstruktion spielen.
Sprachmodelle, die AANN-Beispiele mit größerer Variabilität in den Adjektiv-, Numerale- und Nomen-Slots sehen, lernen die Konstruktion besser als Modelle, die nur wenige, sich wiederholende Beispiele sehen. Dies entspricht Erkenntnissen aus der Linguistik und Kognitionspsychologie zur Rolle von Variabilität beim Lernen.
Insgesamt liefert die Studie den Beweis, dass Sprachmodelle in der Lage sind, seltene grammatische Phänomene durch Generalisierung von häufigeren, verwandten Konstruktionen zu lernen.
Statistiche
"Fünf Meilen ist ein weiter Weg zu gehen."
"1.000 Seiten ist eine Menge für eine Dissertation."
Citazioni
"Eine wunderbare fünf Tage in Texas"
"Eine fünf wunderbare Tage in Texas"