SIB-200: Ein umfangreicher Benchmark-Datensatz für die Klassifizierung von Themen in über 200 Sprachen und Dialekten
Die Schaffung des SIB-200-Datensatzes zielt darauf ab, die Evaluierung von natürlicher Sprachverarbeitung in vielen Sprachen zu verbessern und die Leistung von hoch- und niedrig-ressourcen Sprachen zu vergleichen.