Datensatzgrößen über Sprachen hinweg vergleichen, um gerechte multilinguale Modellentwicklung zu ermöglichen.