Kernkonzepte
Automatisierte Metadatenanreicherung durch Textklassifizierung von Spaltenüberschriften mit Large Language Models (LLMs).
Zusammenfassung
Einleitung
Traditionelle Datensatzabrufsysteme indexieren Metadateninformationen.
Automatisierung der Metadatenanreicherung ist herausfordernd.
Verwandte Arbeit
Semantische Metadatenanreicherung erleichtert die FAIRifizierung von Daten.
Textklassifizierung und LLMs
LLMs revolutionieren die natürliche Sprachverarbeitung.
Unterschiede in der Leistung und Vorlieben der LLMs.
Experimentelles Design und Bewertung
Datensammlung und experimentelles Design für menschliche und maschinelle Klassifizierungsaufgaben.
Ergebnisse
Analyse der LLMs-Klassifizierung, interne Konsistenz, Inter-LLM-Übereinstimmung und Mensch-Computer-Übereinstimmung.
Schlussfolgerung und zukünftige Arbeit
ChatGPT und GoogleGemini übertreffen GoogleBard in der Klassifizierungsaufgabe.
Statistiken
Wir haben keine spezifischen Sätze mit wichtigen Zahlen oder Metriken gefunden.
Zitate
Wir haben keine markanten Zitate gefunden.