المفاهيم الأساسية
Chemische Named Entity Recognition-Modelle zeigen deutliche geschlechtsspezifische Verzerrungen, bei denen weibliche Namen häufiger als Chemikalien fehlklassifiziert werden, insbesondere bei Markenname-Erwähnungen. Darüber hinaus werden Leistungsunterschiede zwischen Daten, die mit weiblichen und männlichen Personen assoziiert sind, beobachtet. Viele Systeme erkennen Verhütungsmittel wie die Pille nicht zuverlässig.
الملخص
Die Studie untersucht geschlechtsspezifische Leistungsunterschiede in chemischen Named Entity Recognition (NER)-Systemen. Dafür werden sowohl synthetische als auch reale Datensätze verwendet.
Die Ergebnisse zeigen, dass chemische NER-Modelle deutliche Verzerrungen aufweisen:
- Synthetische Daten deuten darauf hin, dass weibliche Namen häufiger als Chemikalien fehlklassifiziert werden, insbesondere bei Markenname-Erwähnungen.
- In beiden Datensätzen werden Leistungsunterschiede zwischen Daten mit weiblichen und männlichen Assoziationen beobachtet.
- Viele Systeme erkennen Verhütungsmittel wie die Pille nicht zuverlässig.
Die Studie betont die Notwendigkeit, diese Verzerrungen in chemischen NER-Modellen zu berücksichtigen, um faire und zuverlässige Systeme zu entwickeln.
الإحصائيات
Weibliche Namen werden in synthetischen Daten häufiger als Chemikalien fehlklassifiziert als männliche Namen.
Es gibt Leistungsunterschiede von bis zu 4% in der Recall-Rate zwischen Daten mit weiblichen und männlichen Assoziationen.
In realen Daten werden Verhütungsmittel wie die Pille deutlich schlechter erkannt als andere Medikamentengruppen.
اقتباسات
"Weibliche Namen werden häufiger als Chemikalien fehlklassifiziert, insbesondere bei Markenname-Erwähnungen."
"Viele Systeme erkennen Verhütungsmittel wie die Pille nicht zuverlässig."