본 논문에서는 자체 제공 피드백을 통해 기존 end-to-end NL2SQL 모델의 변환 정확도를 향상시키는 새로운 프레임워크인 CYCLESQL을 제안합니다. CYCLESQL은 데이터 기반의 자연어 설명을 쿼리 결과에 대한 내부 피드백 형태로 도입하여 end-to-end 프로세스 내에 자체 포함된 피드백 루프를 생성하여 변환의 정확성을 반복적으로 자체 평가합니다.
피드백 루프: CYCLESQL은 NL2SQL 프로세스 내에 자체 포함된 피드백 루프를 구축하여 기존 end-to-end 변환 패러다임과 차별화됩니다. 쿼리 결과에 대한 데이터 기반의 자연어 설명을 내부 피드백으로 활용하여 변환의 정확성을 반복적으로 검증하고 전반적인 정확도를 향상시킵니다.
풍부한 설명: CYCLESQL에서 생성된 자연어 설명은 쿼리 표면의 의미뿐만 아니라 데이터 인스턴스의 의미도 통합하여 사용자가 블랙박스 NL2SQL 변환 프로세스를 이해하는 데 도움이 되는 유용한 정보를 제공합니다.
정량적 및 정성적 평가: CYCLESQL을 7가지 NL2SQL 모델과 5개의 공개 벤치마크에 적용하여 성능이 크게 향상되었음을 입증하는 광범위한 실험적 평가를 수행했습니다. 또한 정성적 평가를 통해 생성된 자연어 설명이 사용자 해석 가능성을 향상시키는 데 유용함을 보여주었습니다.
데이터 추적: CYCLESQL은 먼저 설명할 쿼리 결과의 출처 정보를 추적하여 기본 데이터베이스에서 데이터 수준 정보를 수집합니다.
의미 강화: 사용자 의도에 맞춰 변환된 SQL 쿼리에서 파생된 작업 수준 의미와 연결하여 출처 정보를 더욱 강화합니다.
설명 생성: 강화된 출처 정보를 기반으로 쿼리 결과에 대한 자연어 설명을 해석합니다.
변환 검증: 생성된 자연어 설명을 자체 제공 피드백으로 사용하여 기본 NL2SQL 변환의 정확성을 검증하고 검증에 성공할 때까지 위 단계를 반복하여 보다 안정적인 변환 결과를 얻습니다.
CYCLESQL은 데이터 기반 자체 설명을 통해 NL2SQL 변환 정확도를 향상시키는 유망한 프레임워크입니다. CYCLESQL은 NL2SQL 시스템의 정확성, 해석 가능성 및 사용자 경험을 향상시키는 데 상당한 잠재력을 가지고 있습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문