Wir führen den WAV2GLOSS-Task ein, der darauf abzielt, vier Komponenten der Interlinear-Glossierung (Transkription, morphologische Segmentierung, Glossen und freie Übersetzung) direkt aus Sprachaufnahmen zu extrahieren. Wir stellen außerdem den FIELDWORK-Datensatz vor, die erste Sammlung von Sprachaufnahmen mit diesen Annotationen für 37 Sprachen.
Wir stellen eine neue Aufgabe namens WAV2GLOSS vor, bei der aus Sprachaufnahmen automatisch Transkriptionen, morphologische Segmentierungen, Glossen und Übersetzungen in eine Mehrheitssprache extrahiert werden sollen. Außerdem präsentieren wir den FIELDWORK-Datensatz, die erste Sammlung von Sprachaufnahmen mit diesen Annotationen für 37 Sprachen.