toplogo
Sign In

SNAP: Semantische Geschichten für die Vorhersage der nächsten Aktivität


Core Concepts
SNAP nutzt die Reichhaltigkeit der Sprache, um kohärente Geschichten aus Ereignisprotokollen von Geschäftsprozessen zu erstellen und diese zur Verbesserung der Vorhersage der nächsten Aktivität zu verwenden.
Abstract

Der Artikel stellt den SNAP-Algorithmus vor, der darauf abzielt, die Leistung der Vorhersage der nächsten Aktivität in Geschäftsprozessen durch die Nutzung semantischer Informationen in Ereignisprotokollen zu verbessern.

Der Algorithmus besteht aus mehreren Schritten:

  1. Auswahl relevanter Merkmale aus den Ereignisprotokollen
  2. Generierung einer Geschichtenvorlage mithilfe eines großen Sprachmodells (LLM)
  3. Transformation der Prozessverläufe in semantische Geschichten basierend auf der Vorlage
  4. Feinabstimmung eines vortrainierten Sprachmodells (LFM) auf der Aufgabe der Vorhersage der nächsten Aktivität

Die Autoren führen umfangreiche Experimente auf sechs öffentlich zugänglichen Datensätzen durch und zeigen, dass SNAP die aktuellen Benchmark-Modelle signifikant übertrifft, insbesondere für Datensätze mit hohem semantischen Gehalt wie im Bereich der konversationellen Robotic Process Automation (RPA).

edit_icon

Customize Summary

edit_icon

Rewrite with AI

edit_icon

Generate Citations

translate_icon

Translate Source

visual_icon

Generate MindMap

visit_icon

Visit Source

Stats
Die durchschnittliche Fallänge im MIP-Datensatz beträgt 49,6 Aktivitäten. Der NASA-Datensatz enthält 94 verschiedene Aktivitäten. Der BPI13in-Datensatz umfasst 65.533 Ereignisse in 7.554 Fällen.
Quotes
"SNAP's core idea of using the richness of language for transforming processes into semantic stories" "SNAP's state-of-the-art results for the next activity prediction task using the most popular PBPM datasets, including a conversational RPA domain."

Key Insights Distilled From

by Alon Oved,Se... at arxiv.org 03-15-2024

https://arxiv.org/pdf/2401.15621.pdf
SNAP

Deeper Inquiries

Wie könnte SNAP für andere prädiktive Prozessüberwachungsaufgaben wie Ergebnisvorhersage oder Restlaufzeitvorhersage angepasst werden?

Um SNAP für andere prädiktive Prozessüberwachungsaufgaben anzupassen, wie beispielsweise die Vorhersage von Ergebnissen oder Restlaufzeiten, könnten verschiedene Anpassungen vorgenommen werden. Zunächst einmal könnte die Struktur der semantischen Geschichten angepasst werden, um spezifische Informationen zu erfassen, die für diese speziellen Aufgaben relevant sind. Dies könnte die Integration zusätzlicher Merkmale oder Attribute in die Geschichten umfassen, die für die Vorhersage von Ergebnissen oder Restlaufzeiten wichtig sind. Des Weiteren könnte die Feinabstimmung der Sprachgrundmodelle in SNAP entsprechend angepasst werden, um die Modelle auf die spezifischen Vorhersageaufgaben zu trainieren. Dies könnte bedeuten, dass die Modelle mit neuen Trainingsdaten und Labels versehen werden, die auf den gewünschten Vorhersagezielen basieren. Darüber hinaus könnten die Modelle mit verschiedenen Head-Layern oder spezifischen Aufgaben während der Vortrainingsphase erweitert werden, um die Leistung für diese neuen Aufgaben zu optimieren.

Wie könnte SNAP in Szenarien eingesetzt werden, in denen die Verwendung großer Sprachmodelle aus Datenschutzgründen nicht möglich ist?

In Szenarien, in denen aus Datenschutzgründen die Verwendung großer Sprachmodelle wie GPT-3 nicht möglich ist, könnten alternative Ansätze für SNAP in Betracht gezogen werden. Eine Möglichkeit wäre die Verwendung kleinerer Sprachmodelle oder sogar traditioneller ML-Techniken wie XGBoost oder CatBoost für die Vorhersageaufgaben. Diese Modelle könnten möglicherweise nicht die gleiche Leistung wie die großen Sprachmodelle erbringen, könnten aber dennoch akzeptable Ergebnisse liefern. Eine weitere Option wäre die manuelle Konstruktion der Story-Templates anstelle der Verwendung von LLMs wie ChatGPT oder Llama 2. Dies würde bedeuten, dass die Geschichten von Hand erstellt werden, basierend auf den verfügbaren Merkmalen in den Event-Logs. Obwohl dies mehr manuelle Arbeit erfordert, könnte es eine praktikable Lösung sein, um den Datenschutzanforderungen gerecht zu werden und dennoch von der SNAP-Methodik zu profitieren.
0
star