이 논문은 SQL 쿼리 간 의미적 유사도를 정량화하는 새로운 그래프 기반 접근법을 소개한다.
쿼리는 그래프의 노드로 표현되며, 노드 간 전이는 가중치가 부여된 편집 작업으로 정의된다. 최단 경로 알고리즘을 사용하여 두 쿼리 간 최소 비용 편집 시퀀스를 찾음으로써, 쿼리 간 의미적 거리를 정량화할 수 있다.
이 기법은 기존 접근법의 한계를 극복한다. 구문적 비교에 의존하지 않고 의미적 유사도를 측정할 수 있으며, 실행 가능한 쿼리뿐만 아니라 불완전한 쿼리도 처리할 수 있다. 또한 의미적 동등성 여부와 관계없이 유사도를 정량화할 수 있다.
프로토타입 구현 및 사용자 평가를 통해 이 기법이 공정성과 이해도 측면에서 기존 기법을 능가함을 보였다. 이를 통해 SQL 스킬 자동 평가 등 다양한 응용 분야에 활용될 수 있음을 시사한다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Leo ... lúc arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14441.pdfYêu cầu sâu hơn