In dieser Studie untersuchen wir, wie UD-Treebanks mit einer Schicht zur Annotation von Konstruktionen angereichert werden können. Wir definieren Konstruktionen funktional und nicht formal, um einen typologisch informierten Ansatz zu verfolgen. Wir betrachten fünf Konstruktionsfamilien: Interrogativa, Existenziale, Konditionale, Resultative und Nomen-Präposition-Nomen-Kombinationen (NPN).
Für jede Konstruktion entwickelten wir Abfragen, um Instanzen in UD-Treebanks für zehn Sprachen zu identifizieren. Die Ergebnisse zeigen, dass die automatische Annotation von Konstruktionen in UD-Daten möglich ist, aber auch Herausforderungen birgt. Einige Konstruktionen sind schwer zu definieren oder von anderen Konstruktionen abzugrenzen. Außerdem gibt es Unterschiede in der Annotation zwischen Treebanks, die die Suche erschweren.
Insgesamt liefert unsere Studie wichtige Erkenntnisse zur Beschreibung und Identifizierung von Konstruktionen über Sprachen hinweg. Sie legt den Grundstein für zukünftige Anreicherungen von UD-Treebanks mit Konstruktionsannotationen.
To Another Language
from source content
arxiv.org
Deeper Inquiries