Core Concepts
Wir präsentieren die erste Sammlung von Urteilen über die pragmatische Ähnlichkeit zwischen Dialogäußerungen, um die Entwicklung von Modellen zur Messung der pragmatischen Ähnlichkeit zu ermöglichen.
Abstract
Diese Studie präsentiert eine Sammlung von Urteilen über die pragmatische Ähnlichkeit zwischen Dialogäußerungen. Die Autoren haben dafür Sprachaufnahmen aus Dialogen verwendet und diese von Sprechern nachsprechen lassen, wobei verschiedene Bedingungen geschaffen wurden, um unterschiedliche Grade an Ähnlichkeit zu erzeugen. Jedes Paar wurde von 6 bis 9 Beurteilern auf einer kontinuierlichen Skala bewertet. Die durchschnittliche Übereinstimmung zwischen den Beurteilern war mit bis zu 0,72 für Englisch und 0,66 für Spanisch sehr hoch.
Die Autoren erläutern, dass Maße für die semantische und prosodische Ähnlichkeit zwar existieren, es bisher jedoch keine Maße für die pragmatische Ähnlichkeit gibt. Solche Maße wären jedoch für viele Anwendungen, wie die Entwicklung von Sprachsynthesizern, die Bewertung von Maschineller Übersetzung oder die Beurteilung von Sprachproduktionen von Lernenden, sehr wertvoll.
Die Autoren beschreiben den Prozess der Datenerhebung ausführlich, einschließlich der Auswahl der Stimuli, der Methoden zur Erzeugung der Nachsprechungen und des Verfahrens zur Gewinnung der Urteile. Sie analysieren auch Faktoren, die die Urteile und den Grad der Übereinstimmung beeinflusst haben, wie z.B. die Identität der Beurteiler, deren Erfahrung, Unterschiede in Dauer und Lexik zwischen Original und Nachsprechung sowie ungewöhnliche Eigenschaften der Originaläußerungen.
Die Autoren stellen die gesammelten Daten frei zur Verfügung, um die Entwicklung von Modellen zur Messung pragmatischer Ähnlichkeit zu ermöglichen.
Stats
Die durchschnittliche Übereinstimmung zwischen den Beurteilern war mit bis zu 0,72 für Englisch und 0,66 für Spanisch sehr hoch.
Es wurden insgesamt 5.532 Urteile gesammelt.
Quotes
"Pragmatik umfasst alle Aspekte der Sprachverwendung, in denen Menschen über den semantischen Inhalt hinaus Informationen vermitteln."
"Maße für lexikalische und semantische Ähnlichkeit sind für solche pragmatischen Dimensionen unzureichend, insbesondere bei gesprochener Sprache."