In diesem Artikel wird ein neuer Ansatz zur Modellierung und Lösung von Konflikten bei Datenbereinigungsaktionen vorgestellt. In kollaborativen Datenkurationssettings, in denen mehrere Experten unabhängig voneinander arbeiten und dann versuchen, ihre Bemühungen zusammenzuführen, um die Datenbereinigung zu verbessern und zu beschleunigen, entstehen solche Konflikte natürlicherweise.
Der Schlüsselaspekt des Ansatzes ist es, widersprüchliche Aktualisierungen als formalen Argumentationsrahmen (AF) zu modellieren. Solche Argumentationsrahmen können automatisch analysiert und gelöst werden, indem sie in ein Logikprogramm 𝑃𝐴𝐹 übersetzt werden, dessen deklarative Semantik eine transparente Lösung mit vielen wünschenswerten Eigenschaften liefert: Unumstrittene Aktualisierungen werden akzeptiert, ungerechtfertigte werden abgelehnt und verbleibende Mehrdeutigkeiten werden aufgedeckt und dem Benutzer zur weiteren Analyse präsentiert.
Nach der Motivation des Problems wird der Ansatz eingeführt und anhand eines detaillierten Beispiels illustriert, das sowohl die wohlbegründete als auch die stabile Semantik zur Verständnisförderung der AF-Lösungen einführt. Es wurden bereits Open-Source-Tools und Jupyter-Notebooks entwickelt, die die Praxistauglichkeit des Ansatzes demonstrieren. In zukünftigen Arbeiten ist geplant, ein Toolkit für die Konfliktlösung zu entwickeln, das in Verbindung mit OpenRefine, einem beliebten interaktiven Datenbereinigungstool, verwendet werden kann.
To Another Language
from source content
arxiv.org
Deeper Inquiries