Der Artikel präsentiert einen überwachten Lernansatz zur automatischen Extraktion von Schlüsselwörtern aus einzelnen Dokumenten. Der Ansatz verwendet einfach zu berechnende statistische und positionsbasierte Merkmale von Kandidatenphrasen und ist nicht auf externe Wissensdatenbanken oder vortrainierte Sprachmodelle angewiesen.
Der Ranking-Teil der vorgeschlagenen Lösung ist ein relativ leichtgewichtiges Ensemble-Modell. Die Evaluation auf Benchmark-Datensätzen zeigt, dass der Ansatz deutlich genauere Ergebnisse erzielt als mehrere State-of-the-Art-Basismodelle, einschließlich aller getesteten Deep-Learning-basierten unüberwachten Modelle, und mit einigen überwachten Deep-Learning-basierten Modellen konkurrenzfähig ist. Trotz des überwachten Charakters der Lösung hat sie aufgrund der Tatsache, dass sie nicht auf einem Korpus von "goldenen" Schlüsselwörtern oder einer externen Wissensbasis basiert, bis zu einem gewissen Grad die Vorteile unüberwachter Lösungen.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Sriraghavend... at arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07954.pdfDeeper Inquiries