Aufbau eines globalen multilingualen Stereotypen-Datensatzes zur Verbesserung der Sicherheit und Fairness von generativen Modellen.
Twitter-Daten können demografische Merkmale verbessern und die Leistung von Klassifikationsmodellen steigern.
Die Studie konzentriert sich auf den Aufbau eines umgangssprachlichen Datensatzes für die persische Sentiment-Analyse von sozialen Mikroblogs und zeigt die Effektivität eines neuen CNN-Modells.