Erschreckende Sicherheitslücken in großen Sprachmodellen: Eine Untersuchung der Toxizität und Voreingenommenheit
Große Sprachmodelle wie PaLM 2 weisen schwerwiegende Sicherheitslücken auf, die zu hochgradig toxischen und diskriminierenden Inhalten führen können. Die Studie deckt besorgniserregende Muster der Voreingenommenheit gegenüber benachteiligten Gruppen und Minderheiten auf.