Core Concepts
Der Aufbau eines Wissensgraphen für die brasilianische Geschichte basierend auf dem Brasilianischen Historisch-Biografischen Wörterbuch (DHBB) und Wikipedia/Wikidata ist ein komplexes Unterfangen, das erhebliche Anstrengungen erfordert, um die Lücken in Wikidata zu schließen und eine kohärente Wissensstruktur zu schaffen.
Abstract
Dieser Artikel beschreibt die ersten Schritte eines Projekts zum Aufbau eines Wissensgraphen für die brasilianische Geschichte. Das Projekt basiert auf dem Brasilianischen Historisch-Biografischen Wörterbuch (DHBB) und Wikipedia/Wikidata.
Die Autoren stellen fest, dass viele der im DHBB beschriebenen Entitäten (Personen, Orte, Organisationen, politische Ereignisse und Bewegungen) keine entsprechenden Konzepte (oder Q-Elemente) in Wikidata haben, der größten strukturierten Datenbank von mit Wikipedia verknüpften Entitäten.
Die Autoren beschreiben frühere Arbeiten zur Extraktion von Informationen aus dem DHBB-Korpus und skizzieren die Schritte zum Aufbau eines Wikidata-basierten historischen Wissensgraphen. Sie stellen fest, dass nur 51% der Titel der thematischen DHBB-Einträge Wikidata-Konzepte zugeordnet werden können. Bei den biografischen Einträgen können 62% automatisch Wikidata-Einträge zugeordnet werden.
Die Autoren diskutieren verschiedene Herausforderungen bei der Zuordnung, wie Mehrdeutigkeiten, fehlende Einträge für kleinere Konzepte und veraltete Informationen. Sie schließen, dass der Aufbau eines solchen Wissensgraphen für die brasilianische Geschichte eine erhebliche Anstrengung erfordert, um die Lücken in Wikidata zu schließen und eine kohärente Wissensstruktur zu schaffen.
Stats
Es gibt 973 thematische Einträge im DHBB, von denen nur 498 (51%) automatisch Wikidata-Konzepten zugeordnet werden konnten.
Von den 6.980 biografischen Einträgen konnten 4.300 (62%) automatisch Wikidata-Einträgen zugeordnet werden.
Quotes
Keine relevanten Zitate gefunden.