Die Studie untersucht, wie genau GPT-3 Depressionsstressoren über verschiedene demografische Gruppen hinweg erfasst und wie sich diese synthetischen Daten im Vergleich zu menschlich generierten Daten verhalten.
Die Forscher entwickelten HEADROOM, einen synthetischen Datensatz mit 3.120 Beiträgen zu depressionsfördernden Stressoren, bei dem Rasse, Geschlecht und Zeitrahmen (vor und nach COVID-19) kontrolliert wurden. Mithilfe semantischer und lexikalischer Analysen (1) identifizierten sie die vorherrschenden Stressoren für jede demografische Gruppe und (2) verglichen die synthetischen Daten mit einem menschlich generierten Datensatz.
Die Ergebnisse zeigen, dass die synthetischen Daten einige der Verteilungen der menschlich generierten Daten für die vorherrschenden Depressionsstressoren über diverse Demografien hinweg nachahmen. Allerdings identifizierte GPT-3 auch einige Stressoren, die in den menschlich generierten Daten nicht vorhanden waren, wie Rassismus und Polizeigewalt.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Shinka Mori,... kl. arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16909.pdfDybere Forespørgsler