Effiziente Erkennung von Online-Hassrede durch den Einsatz von Künstlicher Intelligenz: Eine Analyse der Herausforderungen und Möglichkeiten großer Sprachmodelle
Große Sprachmodelle wie GPT-3.5 und Llama 2 zeigen eine beachtliche Leistungsfähigkeit bei der Erkennung von Hassrede, wobei GPT-3.5 die besten Ergebnisse erzielt. Allerdings weisen die Modelle auch Schwächen auf, wie eine erhöhte Fehlerrate bei zielgerichteter Hassrede oder bei Hassrede gegen bestimmte Gruppen wie Frauen. Die Wahl des richtigen Prompts ist entscheidend für die Leistung der Modelle.