Core Concepts
Durch die Nutzung von Hyperlinks in Wikipedia-Artikeln kann ein großer Korpus für Geoparsing automatisch erstellt werden, der eine Vielzahl an mehrdeutigen Ortsausdrücken enthält.
Abstract
Die Studie präsentiert eine neue Methode namens "Wikipedia Hyperlink-based Location Linking" (WHLL), um automatisch einen großen Korpus für Geoparsing aus Wikipedia-Artikeln zu erstellen. WHLL nutzt die Hyperlinks in Wikipedia-Artikeln, um Ortsausdrücke mit Koordinaten zu annotieren, auch wenn diese mehrdeutig sind.
Der so erstellte WHLL-Korpus umfasst über 1,3 Millionen Artikel mit durchschnittlich 7,8 eindeutigen Ortsausdrücken pro Artikel. 45,6% der Ortsausdrücke sind mehrdeutig und beziehen sich auf mehrere Orte mit der gleichen Bezeichnung.
Die Autoren führen Experimente zur Geokodierung durch, die zeigen, dass die Disambiguierung von Ortsausdrücken eine Herausforderung darstellt und weiteren Forschungsbedarf erfordert. Der WHLL-Korpus soll Forschern ermöglichen, Geoparsing-Modelle auf einem großen und vielfältigen Datensatz zu trainieren und die Herausforderungen der Mehrdeutigkeit zu adressieren.
Stats
Melbourne ist eine kleine Gemeinde innerhalb des Middlesex County, Ontario, Kanada.
Middlesex County liegt in Ontario, Kanada.
Ontario ist eine Provinz in Kanada.
Kanada ist ein Land.
Strathroy-Caradoc ist eine Gemeinde in Ontario, Kanada.
Southwest Middlesex ist eine Gemeinde in Ontario, Kanada.
Melbourne ist auch eine Stadt in Victoria, Australien.
Quotes
Keine relevanten Zitate gefunden.