KazSAnDRA: Erste und größte öffentlich zugängliche Sammlung von Bewertungen und Einstellungen in kasachischer Sprache
Dieses Papier stellt KazSAnDRA vor, den ersten und größten öffentlich zugänglichen Datensatz für die Sentiment-Analyse in kasachischer Sprache. Der Datensatz umfasst 180.064 Bewertungen aus verschiedenen Quellen und enthält numerische Bewertungen von 1 bis 5, die die Einstellungen der Kunden quantitativ darstellen. Darüber hinaus wurden vier Maschinenlernmodelle entwickelt und evaluiert, um die automatische Klassifizierung kasachischer Sentiments zu ermöglichen.