Core Concepts
Die Nähe von Entitäten im Einbettungsraum spiegelt nicht konsistent deren Ähnlichkeit im Wissensgraphen wider. Die Fähigkeit von Wissensgrafen-Einbettungsmodellen, ähnliche Entitäten nahe beieinander zu positionieren, variiert stark zwischen Modellen und Datensätzen.
Abstract
Die Studie untersucht, inwieweit die Nähe von Entitäten im Einbettungsraum von Wissensgrafen-Einbettungsmodellen (KGEMs) deren Ähnlichkeit im Wissensgraphen widerspiegelt.
Dafür werden verschiedene populäre KGEMs auf mehreren Benchmark-Datensätzen evaluiert. Es zeigt sich, dass die Fähigkeit der Modelle, ähnliche Entitäten nahe beieinander zu positionieren, stark variiert - sowohl zwischen Modellen als auch zwischen Klassen innerhalb eines Datensatzes. Manche Modelle wie TuckER erfüllen die Annahme der Ähnlichkeitserhaltung besser als andere. Zudem korreliert die Leistung der Modelle in Link-Vorhersage-Metriken nur mäßig mit deren Fähigkeit, Ähnlichkeit im Einbettungsraum abzubilden.
Die Ergebnisse legen nahe, dass die Verwendung von Wissensgrafen-Einbettungen für Aufgaben, die auf Entitätenähnlichkeit basieren, mit Vorsicht erfolgen muss, da die Modelle unterschiedliche Vorstellungen von Ähnlichkeit haben.
Stats
Die Ähnlichkeit zweier Entitäten e1 und e2 im Wissensgraphen wird durch den Jaccard-Koeffizienten der 1-Hop- und 2-Hop-Nachbarschaften gemessen.
Quotes
"Die Nähe von Entitäten im Einbettungsraum spiegelt nicht konsistent deren Ähnlichkeit im Wissensgraphen wider."
"Die Fähigkeit von Wissensgrafen-Einbettungsmodellen, ähnliche Entitäten nahe beieinander zu positionieren, variiert stark zwischen Modellen und Datensätzen."