Core Concepts
Qualitative Datenanalyse mit Large Language Models birgt Herausforderungen und erfordert eine task-spezifische Bewertung.
Abstract
Standalone Note:
Einführung in qualitative Datenanalyse und Codierung.
Forschungsmethode zur Evaluierung von Large Language Models (LLMs) in der qualitativen Datenanalyse.
Vergleich der Leistung von LLMs und menschlichen Codierern in verschiedenen Codierungsaufgaben.
Ergebnisse zur Übereinstimmung zwischen menschlichen Codierern und LLMs.
Diskussion über die Leistung von LLMs, methodologische Herausforderungen und Risiken.
Stats
Die Modelle GPT-3.5 und GPT-4 zeigen unterschiedliche Übereinstimmungsraten mit menschlichen Codierern.
GPT-3.5 führte in einer Aufgabe 47 neue, falsche Codes ein.
GPT-4 übertrifft GPT-3.5 in allen Aufgaben.
Quotes
"Wir plädieren für die Bewertung von LLMs auf einer task-spezifischen Basis."
"Die Wahl des Modells und des Few-Shot-Lernens sind entscheidend für die Codierungsleistung."