Die Studie untersuchte die Genauigkeit des Sprachmodells ChatGPT (basierend auf GPT 3.5) bei der Klassifizierung von Botschaften zu Impfungen gegen das humane Papillomavirus (HPV) in sozialen Medien. Dafür wurden Nachrichten von Facebook (Langformat) und Twitter (Kurzformat) gesammelt und von menschlichen Bewertern eingestuft. Eine Stichprobe dieser Nachrichten wurde dann dem Sprachmodell präsentiert, das seine Einschätzungen abgab.
Die Ergebnisse zeigen, dass das Sprachmodell eine hohe Genauigkeit bei der Unterscheidung von anti-impfkritischen und pro-impfbefürwortenden Botschaften erreichte, insbesondere bei Langformat-Nachrichten. Allerdings wies es eine signifikant geringere Genauigkeit bei der Klassifizierung von pro-impfbefürwortenden Botschaften im Vergleich zu anti-impfkritischen auf. Außerdem hatte das Modell Schwierigkeiten, neutrale Botschaften korrekt einzuordnen.
Diese Diskrepanzen verdeutlichen die Notwendigkeit, die Charakteristiken und Grenzen von Sprachmodellen in spezifischen Gesundheitskontexten zu verstehen, um die Zuverlässigkeit und Gültigkeit der Forschungsergebnisse sicherzustellen. Weitere Untersuchungen und Verfahren sind erforderlich, um die Genauigkeit der Modelle für pro-impfbefürwortende Botschaften und neutrale Inhalte zu verbessern.
To Another Language
from source content
arxiv.org
Głębsze pytania