Chemische Named Entity Recognition-Modelle zeigen deutliche geschlechtsspezifische Verzerrungen, bei denen weibliche Namen häufiger als Chemikalien fehlklassifiziert werden, insbesondere bei Markenname-Erwähnungen. Darüber hinaus werden Leistungsunterschiede zwischen Daten, die mit weiblichen und männlichen Personen assoziiert sind, beobachtet. Viele Systeme erkennen Verhütungsmittel wie die Pille nicht zuverlässig.
Durch den Einsatz von Übersetzungsinformationen und großen vortrainierten Sprachmodellen kann die Leistung bei der automatischen Glossierung in Umgebungen mit geringen Ressourcen deutlich verbessert werden.