이 논문은 SQL 쿼리 간 의미적 유사도를 정량화하는 새로운 그래프 기반 접근법을 소개한다.
쿼리는 그래프의 노드로 표현되며, 노드 간 전이는 '편집(edit)'이라 불리는 가중치 있는 변환으로 정의된다. 최단 경로 알고리즘을 사용하여 두 쿼리 간 최소 비용 편집 시퀀스를 찾음으로써, 쿼리 간 의미적 거리를 정량화할 수 있다.
이 기법은 기존 접근법의 한계를 극복한다. 기존 방식은 구문적 비교에 의존하거나 의미적 동치성 검사에 국한되었다. 반면 제안 기법은 부분적으로 올바른 쿼리에 대해서도 의미적 유사도를 측정할 수 있으며, 쿼리 간 차이를 설명하는 의미 있는 피드백을 제공한다. 또한 모든 경우에 대해 결과를 보장한다.
프로토타입 구현 및 사용자 평가를 통해 제안 기법이 기존 기법 대비 공정성과 이해도 측면에서 우수함을 확인하였다. 이는 다양한 데이터베이스 쿼리 비교 작업에 활용될 수 있는 강력한 도구임을 시사한다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문