Core Concepts
Kosinus-Ähnlichkeit von Einbettungen kann zu beliebigen und daher bedeutungslosen Ähnlichkeiten führen.
Abstract
Inhaltsverzeichnis:
Einführung
Einbettung von Entitäten in reale Vektoren
Nutzen von Einbettungen für Ähnlichkeitsmessungen
Modelle der Matrixfaktorisierung
Lineare Modelle für analytische Einblicke
Ziel der Matrixfaktorisierung
Training
Auswirkung der Regularisierung auf die Kosinus-Ähnlichkeit
Unterschiede zwischen den Trainingszielen
Experimente
Simulation von Daten für die Analyse der Kosinus-Ähnlichkeiten
Vergleich der Ergebnisse aus verschiedenen Trainingsansätzen
Schlussfolgerungen
Warnung vor blindem Einsatz der Kosinus-Ähnlichkeit
Vorschläge zur Verbesserung der Ähnlichkeitsmessung
Stats
Cosinus-Ähnlichkeit ist das Skalarprodukt normalisierter Vektoren.
Regulierung beeinflusst die Eindeutigkeit der Ähnlichkeiten.
L2-Norm-Regularisierung in verschiedenen Trainingszielen.
Quotes
"Kosinus-Ähnlichkeit kann zu beliebigen Ergebnissen führen."
"Einbettungen haben einen Freiheitsgrad, der zu arbiträren Ähnlichkeiten führen kann."