Die Bewertung der sprachlichen Vielfalt in multilingualen NLP-Datensätzen erfordert transparente und präzise Maßnahmen.