Die Studie präsentiert MoralBERT, ein Modell zur Vorhersage moralischer Werte in Textinhalten aus verschiedenen sozialen Medien wie Twitter, Reddit und Facebook.
Zunächst wird die Theorie der moralischen Fundamente (Moral Foundations Theory) als theoretische Grundlage erläutert. Anschließend werden die verwendeten Datensätze beschrieben, die Textinhalte mit manuellen Annotationen zu moralischen Werten umfassen.
Es werden zwei Ansätze für die Vorhersage moralischer Werte untersucht: Ein Einzel-Label-Modell, das jeweils einen moralischen Wert vorhersagt, und ein Mehr-Label-Modell, das mehrere moralische Werte gleichzeitig vorhersagt. Die Modelle basieren auf dem BERT-Sprachmodell, das für die Aufgabe feinjustiert wird.
Die Ergebnisse zeigen, dass die MoralBERT-Modelle deutlich besser abschneiden als traditionelle Ansätze wie lexikonbasierte Methoden oder maschinelle Lernmodelle mit Word2Vec-Repräsentationen. Allerdings zeigt sich auch, dass die Einzel-Label-Modelle den Mehr-Label-Modellen überlegen sind, insbesondere bei der Vorhersage auf Daten aus anderen Domänen als der Trainingsdaten.
Zusätzlich wird ein domänenadversarisches Trainingsverfahren untersucht, um die Generalisierbarkeit über verschiedene soziale Medien hinweg zu verbessern. Die Ergebnisse zeigen jedoch, dass dieses Verfahren vor allem im Einzel-Label-Szenario Vorteile bringt, während es im Mehr-Label-Szenario keine Verbesserungen liefert.
Insgesamt zeigt die Studie, dass MoralBERT ein vielversprechender Ansatz ist, um moralische Werte in Textinhalten zu erkennen, aber weitere Forschung nötig ist, um die Leistung insbesondere bei der Übertragung auf neue Domänen zu verbessern.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Vjosa Preniq... klo arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07678.pdfSyvällisempiä Kysymyksiä