toplogo
Sign In

Aufbau eines brasilianischen Geschichts-Wissensgraphen: Herausforderungen und erste Schritte


Core Concepts
Der Aufbau eines Wissensgraphen für die brasilianische Geschichte basierend auf dem Brasilianischen Historisch-Biografischen Wörterbuch (DHBB) und Wikipedia/Wikidata ist ein komplexes Unterfangen, das erhebliche Anstrengungen erfordert, um die Lücken in Wikidata zu schließen und eine kohärente Wissensstruktur zu schaffen.
Abstract
Dieser Artikel beschreibt die ersten Schritte eines Projekts zum Aufbau eines Wissensgraphen für die brasilianische Geschichte. Das Projekt basiert auf dem Brasilianischen Historisch-Biografischen Wörterbuch (DHBB) und Wikipedia/Wikidata. Die Autoren stellen fest, dass viele der im DHBB beschriebenen Entitäten (Personen, Orte, Organisationen, politische Ereignisse und Bewegungen) keine entsprechenden Konzepte (oder Q-Elemente) in Wikidata haben, der größten strukturierten Datenbank von mit Wikipedia verknüpften Entitäten. Die Autoren beschreiben frühere Arbeiten zur Extraktion von Informationen aus dem DHBB-Korpus und skizzieren die Schritte zum Aufbau eines Wikidata-basierten historischen Wissensgraphen. Sie stellen fest, dass nur 51% der Titel der thematischen DHBB-Einträge Wikidata-Konzepte zugeordnet werden können. Bei den biografischen Einträgen können 62% automatisch Wikidata-Einträge zugeordnet werden. Die Autoren diskutieren verschiedene Herausforderungen bei der Zuordnung, wie Mehrdeutigkeiten, fehlende Einträge für kleinere Konzepte und veraltete Informationen. Sie schließen, dass der Aufbau eines solchen Wissensgraphen für die brasilianische Geschichte eine erhebliche Anstrengung erfordert, um die Lücken in Wikidata zu schließen und eine kohärente Wissensstruktur zu schaffen.
Stats
Es gibt 973 thematische Einträge im DHBB, von denen nur 498 (51%) automatisch Wikidata-Konzepten zugeordnet werden konnten. Von den 6.980 biografischen Einträgen konnten 4.300 (62%) automatisch Wikidata-Einträgen zugeordnet werden.
Quotes
Keine relevanten Zitate gefunden.

Key Insights Distilled From

by Valeria de P... at arxiv.org 04-01-2024

https://arxiv.org/pdf/2403.19856.pdf
Towards a Brazilian History Knowledge Graph

Deeper Inquiries

Wie können Historiker und andere Experten in den Prozess der Vervollständigung von Wikidata mit Informationen aus dem DHBB eingebunden werden?

Um Historiker und andere Experten in den Prozess der Vervollständigung von Wikidata mit Informationen aus dem DHBB einzubeziehen, können verschiedene Schritte unternommen werden: Crowdsourcing: Historiker und Experten können aktiv dazu aufgerufen werden, bei der Überprüfung und Ergänzung der automatisch generierten Zuordnungen zwischen DHBB-Einträgen und Wikidata-Elementen zu helfen. Dies kann durch die Bereitstellung eines öffentlich zugänglichen Tools oder einer Plattform erfolgen, auf der sie die Zuordnungen überprüfen und korrigieren können. Workshops und Schulungen: Es können Workshops oder Schulungen organisiert werden, um Historikern und Experten beizubringen, wie sie Wikidata effektiv nutzen können, um Informationen aus dem DHBB zu ergänzen. Dies kann Schulungen zur Verwendung von Wikimapper oder anderen Tools umfassen, die bei der Zuordnung von Einträgen helfen. Kollaborative Forschungsprojekte: Historiker können in kollaborative Forschungsprojekte eingebunden werden, die darauf abzielen, Wikidata mit Informationen aus dem DHBB zu bereichern. Durch die Zusammenarbeit können verschiedene Fachkenntnisse und Perspektiven genutzt werden, um die Genauigkeit und Vollständigkeit der Zuordnungen zu verbessern. Feedback-Mechanismen: Es können Feedback-Mechanismen implementiert werden, um Historikern und Experten die Möglichkeit zu geben, Rückmeldungen zu den automatischen Zuordnungen zu geben und Verbesserungsvorschläge zu machen. Dieser kontinuierliche Austausch kann dazu beitragen, den Prozess der Vervollständigung von Wikidata mit DHBB-Informationen zu optimieren.

Welche zusätzlichen Herausforderungen ergeben sich bei der Extraktion und Strukturierung von Wissen aus weniger gut dokumentierten Sprachen und Kulturen?

Die Extraktion und Strukturierung von Wissen aus weniger gut dokumentierten Sprachen und Kulturen können zusätzliche Herausforderungen mit sich bringen, darunter: Mangelnde Ressourcen: Weniger gut dokumentierte Sprachen und Kulturen verfügen möglicherweise über begrenzte digitale Ressourcen und Datenbanken, was die Extraktion von Wissen erschwert. Sprachliche Vielfalt: In weniger gut dokumentierten Sprachen können sprachliche Vielfalt und Dialekte die automatische Verarbeitung und Analyse von Texten erschweren, da spezifische NLP-Modelle möglicherweise nicht verfügbar sind. Kulturelle Nuancen: Die Extraktion von Wissen aus weniger gut dokumentierten Kulturen erfordert ein tiefes Verständnis der kulturellen Nuancen und Kontexte, um sicherzustellen, dass die extrahierten Informationen korrekt interpretiert werden. Fehlende Verknüpfungen: In weniger gut dokumentierten Sprachen und Kulturen können fehlende Verknüpfungen zu bestehenden Wissensgraphen wie Wikidata die Strukturierung und Integration von Informationen erschweren. Qualitätskontrolle: Die Qualität der extrahierten Informationen aus weniger gut dokumentierten Sprachen und Kulturen kann schwieriger zu überprüfen sein, da Validierungsquellen möglicherweise begrenzt sind.

Wie können die gewonnenen Erkenntnisse aus dem Aufbau des brasilianischen Geschichts-Wissensgraphen auf andere Kontexte übertragen werden, um das digitale Kulturerbe besser zu erschließen?

Die gewonnenen Erkenntnisse aus dem Aufbau des brasilianischen Geschichts-Wissensgraphen können auf andere Kontexte übertragen werden, um das digitale Kulturerbe besser zu erschließen, indem: Interkultureller Austausch: Erfahrungen und Best Practices aus dem brasilianischen Geschichts-Wissensgraphen können mit anderen Ländern und Kulturen geteilt werden, um den Aufbau ähnlicher Wissensgraphen zu fördern. Anpassung von Tools: Die Tools und Methoden, die für den Aufbau des brasilianischen Geschichts-Wissensgraphen verwendet wurden, können angepasst und auf andere Kontexte angewendet werden, um das digitale Kulturerbe in verschiedenen Regionen zu erschließen. Kollaborative Projekte: Durch kollaborative Projekte und Partnerschaften mit anderen Ländern und Institutionen können die Erkenntnisse und Techniken aus dem brasilianischen Geschichts-Wissensgraphen genutzt werden, um das digitale Kulturerbe global zu bereichern. Standardisierung: Die Entwicklung von Standards und Richtlinien für den Aufbau von Wissensgraphen im kulturellen Bereich kann dazu beitragen, die Interoperabilität und den Austausch von Informationen über verschiedene Kontexte hinweg zu erleichtern. Weiterentwicklung von NLP: Die Fortschritte in der Natural Language Processing (NLP) Technologie, die für den brasilianischen Geschichts-Wissensgraphen genutzt wurden, können auf andere Sprachen und Kulturen angewendet werden, um die Extraktion und Strukturierung von Wissen zu verbessern.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star