Das MatchXML-Framework zielt darauf ab, ein effizientes Text-Label-Matching für die Extreme Multi-Label-Textklassifizierung zu bieten. Es verwendet label2vec zur Generierung von dichten Label-Einbettungen und baut einen Hierarchical Label Tree durch Clustering auf. Die Methode formuliert die Multi-Label-Textklassifizierung als ein Text-Label-Matching-Problem in einem bipartiten Graphen und nutzt sowohl dichte Textrepräsentationen als auch statische Satzeinbettungen. MatchXML erzielt Spitzenwerte in Genauigkeit und Geschwindigkeit auf verschiedenen Datensätzen.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Hui Ye,Rajsh... alle arxiv.org 03-12-2024
https://arxiv.org/pdf/2308.13139.pdfDomande più approfondite