Core Concepts
Die Prävalenz von toxischen und geschlechterdiskriminierenden Inhalten in Kommentaren zu Issues und Pull Requests beeinflusst die wahrnehmbare Vielfalt in Bezug auf Geschlecht, ethnische Zugehörigkeit und Betriebszugehörigkeit in Open-Source-Software-Projekten.
Abstract
Die Studie untersucht den Zusammenhang zwischen der Prävalenz von toxischen und geschlechterdiskriminierenden Inhalten in Kommentaren zu Issues und Pull Requests und der wahrnehmbaren Vielfalt in Open-Source-Software-Projekten.
Dafür werden folgende Schritte durchgeführt:
- Extraktion von Daten zu aktiven GitHub-Projekten, die bestimmte Kriterien erfüllen
- Identifizierung von toxischen und geschlechterdiskriminierenden Inhalten in den Issue- und Pull-Request-Kommentaren mithilfe von Textanalysewerkzeugen
- Berechnung von Diversitätsindizes (Blau-Index) für Geschlecht, ethnische Zugehörigkeit und Betriebszugehörigkeit der Projektbeitragenden
- Erstellung von Regressionsmodellen, um den Zusammenhang zwischen der Prävalenz von toxischen/diskriminierenden Inhalten und den Diversitätsindizes zu untersuchen
- Zeitreihenanalyse, um den Zusammenhang zwischen Veränderungen in der Prävalenz von toxischen/diskriminierenden Inhalten und Veränderungen in den Diversitätsindizes zu analysieren
Die Ergebnisse sollen empirische Belege für den Einfluss von toxischer und geschlechterdiskriminierender Kommunikation auf die wahrnehmbare Vielfalt in Open-Source-Software-Projekten liefern.
Stats
Die Prävalenz von toxischen Kommentaren in einem Projekt ist mit einer geringeren Geschlechter-, Ethnizitäts- und Betriebszugehörigkeits-Diversität assoziiert.
Die Prävalenz von geschlechterdiskriminierenden Kommentaren in einem Projekt ist mit einer geringeren Geschlechter-, Ethnizitäts- und Betriebszugehörigkeits-Diversität assoziiert.
Quotes
"..it's time to do a deep dive into the mailing list archives or chat logs. ... Searching for terms that degrade women (chick, babe, girl, bitch, cunt), homophobic slurs used as negative feedback ("that's so gay"), and ableist terms (dumb, retarded, lame), may allow you to get a sense of how aware (or not aware) the community is about the impact of their language choice on minorities."