Основные понятия
Dieser Artikel präsentiert einen neuartigen graphenbasierten Ansatz zur Messung der semantischen Unähnlichkeit zwischen SQL-Abfragen. Abfragen werden als Knoten in einem impliziten Graphen dargestellt, wobei die Übergänge zwischen den Knoten als Bearbeitungen bezeichnet werden, die nach semantischer Unähnlichkeit gewichtet sind. Durch den Einsatz von Kürzestpfad-Algorithmen wird die kostengünstigste Bearbeitungssequenz zwischen zwei gegebenen Abfragen identifiziert, wodurch ein quantifizierbares Maß für den semantischen Abstand definiert wird.
Аннотация
Der Artikel beschreibt einen neuartigen graphenbasierten Ansatz zur Messung der semantischen Ähnlichkeit zwischen SQL-Abfragen. Kernidee ist es, Abfragen als Knoten in einem impliziten Graphen darzustellen, wobei die Übergänge zwischen den Knoten als "Bearbeitungen" bezeichnet werden, die mit Kosten für die semantische Unähnlichkeit versehen sind. Durch den Einsatz von Kürzestpfad-Algorithmen kann dann die kostengünstigste Bearbeitungssequenz zwischen zwei Abfragen identifiziert werden, was ein quantifizierbares Maß für den semantischen Abstand ergibt.
Der Artikel gliedert sich wie folgt:
- Definitionen zu syntaktischer und semantischer Äquivalenz von Abfragen sowie Ausführbarkeit
- Erläuterung der Kernidee des graphenbasierten Ansatzes
- Definition der Knotenrepräsentation, die sowohl syntaktische als auch semantische Unterschiede berücksichtigt und auch nicht-ausführbare Abfragen zulässt
- Beschreibung verschiedener Arten von Bearbeitungen (Edits), darunter atomare Bearbeitungen für grundlegende Änderungen und semantikbewusste Abkürzungsbearbeitungen
- Darstellung des Algorithmus zur Bestimmung des semantischen Abstands, der die Terminierung garantiert
- Erläuterung der Verwendung des berechneten Abstands für die Bewertung von Abfragen
Статистика
Es gibt keine spezifischen Kennzahlen oder Zahlen, die im Artikel verwendet werden.
Цитаты
"Zwei SQL-Abfragen sind semantisch äquivalent im Kontext eines gegebenen Datenbankschemas, wenn sie bei Ausführung auf einer beliebigen, aber festen Datenbank dieses Schemas genau das gleiche Ergebnis liefern."
"Atomare Bearbeitungen sind die grundlegenden Bearbeitungen, die eine kleine, atomare Änderung am AST einer Abfrage vornehmen. Zum Beispiel gibt es für jede (Teil-)Komponente entsprechende Hinzufüge- und Entfernungsbearbeitungen, und für jedes Attribut entsprechende Setz- und Löschbearbeitungen."
"Äquivalenzbearbeitungen sind Bearbeitungen mit Kosten von 0. Sie verbinden diejenigen Abfragen, die als semantisch äquivalent betrachtet werden sollen, und sind meist Abkürzungsbearbeitungen, aber es können auch bestimmte atomare Bearbeitungen darunter sein, je nach genauer Implementierung des AST und Konfiguration."