Dieser Artikel beschreibt die ersten Schritte eines Projekts zum Aufbau eines Wissensgraphen für die brasilianische Geschichte. Das Projekt basiert auf dem Brasilianischen Historisch-Biografischen Wörterbuch (DHBB) und Wikipedia/Wikidata.
Die Autoren stellen fest, dass viele der im DHBB beschriebenen Entitäten (Personen, Orte, Organisationen, politische Ereignisse und Bewegungen) keine entsprechenden Konzepte (oder Q-Elemente) in Wikidata haben, der größten strukturierten Datenbank von mit Wikipedia verknüpften Entitäten.
Die Autoren beschreiben frühere Arbeiten zur Extraktion von Informationen aus dem DHBB-Korpus und skizzieren die Schritte zum Aufbau eines Wikidata-basierten historischen Wissensgraphen. Sie stellen fest, dass nur 51% der Titel der thematischen DHBB-Einträge Wikidata-Konzepte zugeordnet werden können. Bei den biografischen Einträgen können 62% automatisch Wikidata-Einträge zugeordnet werden.
Die Autoren diskutieren verschiedene Herausforderungen bei der Zuordnung, wie Mehrdeutigkeiten, fehlende Einträge für kleinere Konzepte und veraltete Informationen. Sie schließen, dass der Aufbau eines solchen Wissensgraphen für die brasilianische Geschichte eine erhebliche Anstrengung erfordert, um die Lücken in Wikidata zu schließen und eine kohärente Wissensstruktur zu schaffen.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania