Die Analyse von Wortarten-Sequenzen (POS) ermöglicht es, syntaktische Ähnlichkeiten und Unterschiede zwischen Sprachen zu quantifizieren und deren Beziehungen zu untersuchen.
Große Sprachmodelle haben Schwierigkeiten, das Konzept der verursachten Bewegungskonstruktion zu verstehen.
Große Sprachmodelle zeigen Sensibilität für semantische Eigenschaften, aber scheitern an der NOVELTY-Bedingung.
Annotation Richtlinien für MaiBaam Corpus.
Die Entwicklung eines neuen Datensatzes für die Sentiment-Analyse in Magahi-Hindi-Englisch (MHE) Code-Mixed-Sprache wird vorgestellt.
NLP-Technologien benachteiligen sozioökonomisch benachteiligte Gruppen und sollten soziale Klassenunterschiede berücksichtigen.
Die Studie untersucht die Vorhersagbarkeit von Pluralität und Bestimmtheit in chinesischen Nominalphrasen durch den Kontext.
Ein neuer Analyserahmen für die Kategorisierung von prosodischen Signalen und deren Verbindung mit Bedeutung.
Automatische Bewertung von Satzübersetzungsübungen ist eine herausfordernde Aufgabe, selbst für modernste Sprachmodelle.
MELA präsentiert ein Benchmark für sprachliche Akzeptanzbewertung in 10 Sprachen, zeigt die Bedeutung von in-sprachlichen Daten und verbessert die Syntaxkapazität von XLM-R.