本文提出了一個中心數據存儲中心的概念,以支持物件導向過程挖掘的動態和可擴展數據準備。該中心存儲中心採用了一種鬆耦合的樞紐和輻條架構,將數據源與應用程序分離,從而提高了靈活性和可維護性。
文章首先提出了一系列要求,包括:
健壯的數據模型:數據模型應該與過程細節無關,並支持持續添加新數據而無需修改模式。
可擴展的數據存儲:支持高效的查詢模式,支持數據分區以提高性能,並支持異步數據引入。
靈活性和功能性:支持事件與對象之間的多種關係類型,支持對象與對象之間的動態關係。
通用數據集成:支持從不同源和數據類型引入數據,並提供靈活的導入和導出擴展以支持不同的格式。
基於這些要求,文章提出了一個關係模式,作為中心數據存儲中心的核心。該模式支持動態變化,並與OCEL 2.0等領先格式兼容。
文章還介紹了一個名為Stack't的開源工具,它實現了所提出的關係模式,並提供了數據引入、質量檢查、可視化等功能,以支持物件導向過程挖掘。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Lien Bosmans... às arxiv.org 10-02-2024
https://arxiv.org/pdf/2410.00596.pdfPerguntas Mais Profundas