Die Studie führt eine neuartige Methode zur Darstellung und Berechnung von Wortmengen in Vektorräumen ein, die auf den Prinzipien der Quantenlogik basiert.
Zunächst wird erläutert, wie Wörter als Vektoren und Wortmengen als lineare Teilräume (Subräume) in Einbettungsräumen dargestellt werden können. Darauf aufbauend werden grundlegende Mengenoperationen wie Vereinigung, Schnittmenge und Komplement definiert, die den Gesetzen der Mengenlehre in der Quantenlogik entsprechen.
Um die Nützlichkeit des vorgeschlagenen Ansatzes zu demonstrieren, werden zwei Anwendungen präsentiert:
Textähnlichkeit: Die Autoren erweitern die bekannte BERTScore-Metrik, indem sie die Vektordarstellung von Sätzen durch Subräume ersetzen und eine subspannenbasierte Indikatorfunktion verwenden. Dieses "SubspaceBERTScore"-Verfahren zeigt konsistent bessere Ergebnisse als die ursprüngliche BERTScore-Metrik.
Mengenerweiterung: Die Autoren wenden ihre subspannenbasierten Mengenoperationen auf die Aufgabe der Mengenerweiterung an, bei der ausgehend von einer Anfangsgruppe von Wörtern weitere relevante Wörter identifiziert werden sollen. Auch hier übertrifft der vorgeschlagene Ansatz die Leistung bestehender Methoden.
Die Ergebnisse zeigen, dass die Repräsentation von Wortmengen als Subräume und die darauf aufbauenden Berechnungen einen vielversprechenden Ansatz darstellen, um die semantischen Beziehungen zwischen Wortgruppen effektiv zu erfassen und auszunutzen.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yoichi Ishib... alle arxiv.org 04-10-2024
https://arxiv.org/pdf/2210.13034.pdfDomande più approfondite