Core Concepts
Ein effizienter Algorithmus, CoverSumm, der extraktive Zusammenfassungen in einem inkrementellen Setup unter Verwendung von Cover-Bäumen erstellt.
Abstract
In dieser Arbeit wird das Problem der extraktiven Meinungszusammenfassung in einem inkrementellen Setup untersucht, bei dem ein System mit jedem eingehenden Kundenbericht eine aktualisierte Zusammenfassung erstellt. Die Autoren präsentieren CoverSumm, einen effizienten Algorithmus, der extraktive Zusammenfassungen unter Verwendung von Cover-Bäumen erstellt. CoverSumm verwaltet einen kleinen Reservoir von Kandidatenzusammenfassungssätzen und führt die Suche nach den nächsten Nachbarn hauptsächlich in diesem Reservoir durch, anstatt die gesamte Menge der Rezensionen zu verarbeiten. Die theoretische Analyse zeigt, dass CoverSumm die exakten nächsten Nachbarn generiert und die Anzahl der erforderlichen Suchanfragen begrenzt. Die empirischen Ergebnisse zeigen, dass CoverSumm bis zu 36-mal schneller ist als Baseline-Methoden und qualitativ hochwertige Zusammenfassungen erstellt, die mit den zugrunde liegenden Kundenrezensionen übereinstimmen.
Stats
Die Entfernung des aktuellen Mittelwerts µt vom letzten abgefragten Mittelwert µlast kann durch
p
2αDb2 log(2/δ)/t beschränkt werden.
Die Anzahl der erforderlichen Reservoir-Suchvorgänge wächst mit O(D log n), wobei n die Gesamtzahl der Punkte (z.B. Rezensionssätze) und D die Dimensionalität der Daten ist.
Die maximale Größe des Reservoirs |R| ist O(k), wobei k die Anzahl der Zusammenfassungssätze ist.
Quotes
"Extraktive Meinungszusammenfassung ist der Prozess des automatischen Generierens von Zusammenfassungen von Nutzerrezensionen über Entitäten (wie E-Commerce-Produkte)."
"Die Qualität und Effizienz der Erstellung der Zusammenfassung hängt von der extraktiven Zusammenfassungsmethode ab."