Core Concepts
도메인별 그래프 데이터베이스에 대한 대규모 언어 모델을 정렬하는 방법을 제안합니다.
Abstract
그래프 데이터베이스와 NL2GQL 작업의 어려움
ChatGPT를 활용한 NL-GQL 데이터 쌍 생성
LLMs를 그래프 데이터베이스에 맞추기 위한 파이프라인 제안
실험 결과 및 성능 평가
도메인별 LLMs와 일반 LLMs의 성능 비교
Stats
실험 결과는 FinGQL 데이터셋에서 EM이 5.90%, EX가 6.00% 향상되었음
MediGQL 데이터셋에서 EM이 6.36%, EX가 7.09% 향상되었음
Quotes
"대규모 언어 모델을 그래프 데이터베이스에 정렬하는 파이프라인을 제안합니다."
"ChatGPT를 사용하여 NL-GQL 데이터 쌍을 생성하고 LLMs를 세밀하게 조정합니다."